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“Paul 出 色 阐 释 了 调试 各 个 阶段 所 涉及 的 技术 、 思 维 、 心 理 等 方面 的 问题 : 首先 要 预防 缺陷 发 生 ， 然 后 诊断 和 修复 缺 

陷 ， 并 确保 相同 的 缺陷 不 再 发 生 。 应 用 本 书 的 任何 一 种 思想 都 有 助 提高 软件 项 目的 整体 质量 。 当 然 ，Paul 从 心理 学 的 角度 
很 好 地 阐述 了 技术 问题 ， 这 也 是 本 书 的 一 大 特色 。” 

一 一 Frederic Daoud, Stripes: ...and Java Web Development Is Fun Again 作 者 


“我 由 囊 地 向 大 多 数 软件 工程 师 推荐 这 本 书 ， 特 别 想 把 它 推荐 给 力图 实现 最 佳 实践 的 团队 领导 。” 
一 一 Allan McLeod，lsaacc 软 件 公司 创始 人 兼 首席 技术 官 


“本 书 在 设置 调试 场景 、 获 得 正确 思维 模式 方面 讲 了 很 多 ， 同 时 也 谈 到 当 缺 陷 发 生 及 解决 后 可 能 出 现 的 连带 问题 。 单 
是 其 中 的 轶 事 就 非常 值得 一 读 ， 你 会 看 到 软件 工程 师 们 在 试图 了 解 真正 奇怪 的 缺陷 时 是 多 么 百折不挠 。” 
一 一 Jon Dickinson, Grails 1.1 Web Application Development 作 者 


“长 时 间 以 来 ， 调 试 技术 一 直 是 一 项 “民间 艺术 '”。 现 在 有 人 把 所 有 这 些 经 过 实践 验证 的 技术 归纳 总 结 起 来 ， 这 真是 

一 件 非常 了 不 起 的 事 。 当 你 对 如 何 创建 优秀 软件 的 过 程 一 无 所 知 时 ， 这 本 书 可 以 很 好 地 给 你 指明 方向 。 当 你 有 了 断言 、 日 
志 、 重 构 等 好 方法 时 ， 你 会 觉得 自己 就 是 福尔摩斯 ， 没 有 什么 疑案 是 破解 不 了 的 。” 

一 一 Craig Riecke，《 精 通 Dojo》 作 者 


“这 本 书 就 像 《 程 序 员 修 炼 之 道 》 的 姊妹 篇 ， 它 将 注意 力 集中 在 调试 的 技巧 上 。” 
—an Dees, Scripted GUI Testing with Ruby 作 者 


“Paul Butcher 讲 述 了 我 们 早 该 关注 的 调试 方法 。 对 于 每 一 位 软件 工程 师 来 说 ， 调 试 是 一 项 基本 活动 ， 而 大 多 数 人 仍 

然 在 靠 直觉 和 猜测 来 进行 调试 。Paul 朴 实 无 华 的 写作 风格 掩盖 不 住 他 在 技术 方面 的 超群 素养 。 如 果 不 了 解 调试 ， 那 你 只 能 
是 一 名 软件 工程 师 ， 而 永远 无 法 成 为 黑客 级 程序 员 。” 

一 一 Bill Karwin，Karwin 软 件 公司 软件 工程 师 
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我 一 直 想 不 明 白 , 为 什么 关于 调试 的 书 这 么 少 。 其 他 软件 工程 方面 的 书 可 谓 汗 牛 充 栋 , 设计 、 
代码 结构 、 需 求 获 取 、 方 法 学 ， 林林总总， 然而 有 关 调 试 方面 的 书 却 既 没有 什么 人 写 ， 也 没有 什 
么 人 出 ,我 希望 这 本 书 有 助 于 改善 这 种 情况 。 


如 果 写 代码 ， 那 么 在 某 些 时 候 肯 定 要 调试 代码 (也 许 很 快 就 需要 调试 )。 调 试 比 其 他 任何 过 
程 都 更 需要 动脑 ， 它 不 发 生 在 调试 器 或 代码 中 ， 而 是 形成 于 大 脑 之 中 。 找 到 并 理解 问题 的 根源 ， 
才能 进行 其 他 的 工作 。 


多 年 来 , 我 有 幸 在 多 个 软件 领域 与 许多 出 色 的 团队 共事 。 我 兽 做 过 位 片 处 理 机 微 编码 的 所 有 
抽象 层次 上 的 工作 ,涉猎 过 设备 驱动 程序 、 和 散人 式 代码 、 主 流 台 式 机 软件 和 网 络 应 用 程序 。 我 希 
望 能 够 通过 这 本 书 总 结 一 些 我 从 同事 那里 得 到 的 经 验 教训 。 


关于 本 书 
本 书 分 为 三 部 分 ， 每 一 部 分 都 详细 阐述 了 调试 的 某 一 方面 。 
第 一 部 分 “问题 的 核心 


这 部 分 介绍 了 实证 方法 , 即 借助 软件 特有 的 功能 向 我 们 展示 这 是 怎么 回 事 儿 ， 以 及 建立 在 实 
证 方法 之 上 的 核心 调试 方法 〈 问 题 重 现 、 问 题 诊断 、 缺 陷 修复 、 反 思 )。 


第 二 部 分 “从 大 局 看 调试 

我 们 怎样 发 现存 在 需要 修复 的 问题 ?又 怎样 将 调试 融入 到 更 广泛 的 软件 开发 过 程 中 去 ? 
第 三 部 分 ”深入 调试 技术 

这 部 分 将 关注 一 些 高 级 的 话题。 


2. i $ 


口 尽管 本 书 前 面 讨论 的 方法 适用 于 所 有 缺陷 ， 但 某 些 类 型 的 缺陷 还 是 需要 特别 对 待 。 

O 调试 应 该 早早 启动 ， 不 要 等 到 受 困 的 客户 愤怒 地 打 电 话 来 才 开始 调试 。 我 们 能 够 提前 采 
取 什 么 措施 和 流程 来 解决 客户 可 能 提出 的 问题 呢 ? 

O 最 后 讨论 如 何 避 免 一 些 常见 的 缺陷 。 


致谢 
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第 了 章 
山 重 水 复 疑 无 路 


如 果 你 的 软件 不 能 正常 工作 ， 该 怎么 做 呢 ? 


一 些 开 发 人 员 似乎 有 窍门 能 够 准确 无 误 地 找 出 发 生 缺 陷 的 根本 原因 , 而 另 一 些 开发 人 员 似乎 
总 在 漫 无 目的 地 寻找 原因 却 得 不 到 确切 的 结果 。 是 什么 使 他 们 之 间 存 在 着 这 样 的 差异 呢 ? 


在 这 一 章 中 ,我 们 将 仔细 探究 一 种 调试 方法 , 这 种 方法 在 专业 的 软件 开发 中 已 经 被 反复 证 实 。 
它 绝 非 灵丹妙药 ， 它 仍然 依赖 于 调试 者 的 智慧 、 直觉、 探查 缺陷 的 技巧 ,甚至 一 点 儿 运气 。 但 是 ， 
它 会 使 你 的 努力 更 加 有 效 ， 避 免 做 无 用 功 ， 并 且 能 够 尽快 地 找到 问题 的 核心 。 


具体 来 说 ， 我 们 将 介绍 以 下 内 容 : 


O 调试 与 排除 缺陷 的 区 别 ， 

实证 方法 一 一 借助 软件 本 身 来 告诉 你 现在 的 运行 状态 ; 
核心 调试 过 程 〈 问 题 重 现 ， 问 题 诊断 ， 缺 陷 修 复 ， 反 思 )， 
做 最 先 应 该 做 的 事 一 一 在 深入 调试 之 前 应 该 先 考虑 的 事情 。 


1.1 调试 不 仅 是 排除 缺陷 


试问 一 个 没有 经 验 的 程序 员 什么 是 调试 , 他 可 能 回答 调试 就 是 “找到 一 种 修复 缺陷 的 方法 ”。 
事实 上 ， 这 仅仅 是 调试 诸多 目标 中 的 一 个 ， 甚 至 不 是 最 重要 的 目标 。 


有 效 的 调试 需要 采取 以 下 步骤 。 


O 乔 清楚 软件 为 什么 会 运行 失常 。 

(2) 修复 这 一 问题 。 

(3) 避免 破坏 其 他 部 分 。 

(4) 保持 或 者 提高 代码 的 总 体质 量 ( 可 读 性 、 架 构 、 测 试 覆盖 率 、 性 能 等 )。 
(5) 确保 同样 的 问题 不 会 在 其 他 地 方 发 生 ， 也 不 会 再 次 发 生 。 


1.1 调试 不 仅 是 排除 缺陷 A 3 
其 中 ， 目 前 最 重要 的 是 首先 查 明 问题 的 根本 原因 ， 这 是 一 切 事情 的 基础 。 
理解 万 岁 


一 些 没有 经 验 的 开发 人 员 (遗憾 的 是 ， 有 时 就 是 我 们 中 本 应 知道 得 更 多 的 那些 人 ) 经 常 完全 
忽略 问题 诊断 这 一 过 程 ， 而 是 往往 立即 采取 他 们 认为 能 够 修复 程序 的 措施 。 如 果 他 们 走运 ， 只 是 
修改 了 的 程序 运行 不 了 , 他 们 所 做 的 一 切 是 在 浪费 时 间 而 已 。 真正 的 危险 是 修改 了 的 程序 可 以 运 
行 ， 或 者 看 来 可 以 运行 ， 因 为 这 时 开发 人 员 在 一 知 半 解 的 情况 下 改变 了 源 程 序 。 他 或 许 修复 了 缺 
陷 ， 但 是 实际 上 很 可 能 掩盖 了 潜在 的 根本 原因 。 更 糟糕 的 是 ， 这 种 改变 可 能 会 导致 新 问题 一 ae 
坏 一 些 曾经 可 以 正确 运行 的 程序 。 


浪费 时 间 和 精力 


儿 年 前 ,我 在 一 个 拥有 很 多 具有 丰富 经 验 的 天 才 开发 人 员 的 团队 中 工作 。 他 们 的 经 
验 大 部 分 来 自 UNIX 操作 系统 ， 但 是 当 我 加 入 这 个 团队 时 ， 他 们 正 处 于 将 软件 移植 到 
Windows 操作 系统 的 后 期 阶段 。 


在 移植 的 过 程 中 , 他 们 发 现 了 一 个 缺陷 , 就 是 同时 运行 多 个 线程 时 出 现 了 性 能 问题 。 
某 些 线程 突然 死 掉 ， 而 另外 的 线程 在 正常 运行 。 


所 有 的 程序 在 UNIX 操作 系统 下 运行 正常 ， 问 题 很 显然 是 Windows 操作 系统 破坏 
了 线程 , 因此 他 们 决定 定制 一 个 线程 调度 系统 , 以 避免 使 用 操作 系统 所 提供 的 调度 系统 。 
显然 这 是 一 项 很 繁重 的 工作 ， 但 是 我 们 的 团队 有 能 力 完成 这 项 工作 。 


我 加 入 这 个 团队 时 , 他 们 正在 以 各 种 方式 实现 这 项 工作 , 果然 ,线程 不 再 突然 死 掉 。 
但 是 ,线程 调度 是 难以 捉摸 的 ， 即 使 变化 引起 了 很 多 问题 (比如 使 整个 系统 运行 变 慢 )， 
这 些 线程 仍然 能 够 继续 工作 。 


我 对 这 个 缺陷 很 好 奇 ， 因 为 在 以 前 的 Windows 线程 编程 中 ， 我 从 来 没 碰 到 过 这 样 
的 问题 。 咯 作 调 查 后 我 们 发 现 , 性 能 问题 事实 上 是 由 于 Windows 实现 了 动态 线程 优先 。 
这 个 缺陷 其 实 通过 禁用 一 行 代码 就 可 以 修复 (MWA SetThreadPriorityBoostQ § 
数 ) 。 


这 件 事情 告诉 了 我 们 什么 ? 该 团队 没有 深入 调查 所 看 到 的 现象 ， 就 下 结论 ， 认 为 
Windows 线程 被 破坏 。 在 某 种 程度 上 ， 这 可 能 是 文化 问题 ，Windows 在 UNIX RA P 
誉 不 佳 。 不 过 ， 如 果 他 们 花 点 儿 时 间 找 出 问题 的 根源 ， 就 能 省 去 大 量 的 工作 ， 避 免 引 入 
使 系统 效率 低下 并 易 产 生 错误 的 复杂 因素 。 
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如 果 不 首先 弄 清楚 缺陷 的 真正 根源 , 我 们 就 没有 遵循 软件 工程 的 原则 , 而 是 一 头 扎 进 焉 毒 编 
程 (voodoo programming) ?或 者 巧合 编程 (programming by coincidence) "里 了 。 


1.2 ”实证 方法 


可 以 采用 很 多 不 同方 法 去 实现 你 所 探查 的 目标 。 只 要 你 选择 的 方法 让 你 更 接近 目标 ， 它 就 达 
到 了 日 的 。 


话 虽 如 此 ， 在 大 多 数 情 况 下 ， 一 种 特别 的 方法 一 一 实证 方法 ， 是 迄今 为 止 最 有 效 的 方法 。 


ikh 实证 依赖 的 是 观察 和 经 验 ， 而 不 是 理论 和 纯 逻 辑 推 

y * evince 理 。 就 调试 而 言 ， 这 意味 着 直接 观察 软件 的 行为 。 是 的 ， 
mstruct experiments and ets 、 
Penne gene a 你 可 以 阅读 全 部 的 源 代码 ， 并 用 纯 理论 去 了 解 软 件 的 运行 
状况 (有 时 你 可 能 没有 其 他 选择 )， 但 是 这 样 做 通常 没 什 
么 效率 ,而 且 非 常 危险 。 通过 仔细 地 构建 实验 坏 境 并 观察 软件 的 运行 状况 ,你 可 以 更 有 效 地 找到 
问题 。 这 样 做 不 仅仅 更 快捷 , 而 且 通 过 观察 可 以 使 你 重新 审视 自己 关于 软件 运行 还 有 哪些 错误 的 
假设 。 软 件 本 身 就 是 你 的 工具 箱 中 最 强 有 力 的 工具 一 一 就 让 它 来 告诉 你 运行 状况 是 什么 样 的 吧 。 








软件 的 本 质 


”软件 是 非常 了 不 起 的 产品 。 有 了 时， 或 许 是 因为 我 们 一 直 与 它 一 起 工作 ， 所 以 才 会 忘记 它 | 
是 多 么 地 了 不 起 。 

人 类 的 经 验 中 有 一 小 部 分 具有 可 塑性 ， 克 许 我 们 毫 无 限制 地 自由 发 挥 聪明 才智 和 创造 力 。 
当然 ,软件 是 确定 性 的 (有 少数 例外 ， 后面 会 提 到 ) 一 一 下 一 个 状态 完全 取决 于 当前 的 状态 ;| 
更 为 关键 的 是 ， 只 要 需要 ， 我 们 就 可 以 进入 各 个 状态 。 
| 相对 于 传统 的 工程 学 ， 我 们 太 幸 运 了 。 你 认为 一 名 EF1 工程 师 会 肥 间 停止 每 分 钟 19 000 
| 转 的 引擎 来 检查 它 的 每 一 个 细节 吗 ? 例如 ,他 能 查看 每 个 组 件 在 压力 下 的 精确 状态 , 动态 记 
录 点 火 时 燃烧 室内 前 方 火焰 的 位 置 和 形状 吗 ? 


a BAT Ap He 6 SE ARIK AP AR 75 He He BAT OAL A, 这 就 是 为 什么 在 调试 时 实证 方法 特别 强大 
| 的 原因 。 
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O “ERDE SA RIRAURS. BERAR, AUT RESIERR EER, WADE Pe FMA. HA 
是 ， 该 技术 可 能 无 法 工作 ， 如 果 它 没 工 作 ， 人 们 永远 不 知道 是 为 什么 。” 摘自 The Jargon File[ray]。 
© 见 The Pragmatic Programmer{(HTOO], 


1.3 核心 调试 过 程 AS 
下 一 节 中 描述 的 方法 将 会 利用 实证 法 去 提供 一 个 结构 化 的 手段 来 集中 找 出 缺陷 。 
1.3 ”核心 调试 过 程 
调试 过 程 的 核心 包括 以 下 四 步 。 
问题 重 现 ” 找 一 个 可 靠 并 简洁 的 方式 来 按 需求 重 现 问题 。 


问题 诊断 提出 假设 ， 并 通过 实验 来 测试 它们 ， 直 到 找 出 引起 缺陷 的 潜在 原因 。 


缺陷 修复 ”设计 和 进行 一 些 修改 来 修复 问题 , 不 要 引入 回归 问题 , 保持 和 提高 软件 的 整体 质 
i. 


反思 吸取 教训 。 哪 里 出 了 问题 ? 是 否 还 有 其 他 类 似 个 
的 问题 需要 修复 ? 怎样 做 才能 确保 同样 的 问题 不 再 发 生 ? Debugging is an iterative 


如 图 1-1 所 示 。 一 般 来 说 ， 这 些 步骤 是 按 顺 序 执行 的 ， ~ 一: 
但 这 并 不 是 严格 的 “瀑布 ” 模型。 虽说 你 肯定 不 希望 直到 重 现 了 问题 或 者 设计 了 修复 计划 后 才 启 
动 诊断 ， 而 后 才 明 白 所 发 生 的 问题 ， 但 这 是 一 个 迭代 的 过 程 。 在 问题 诊断 中 学 到 的 知识 可 能 会 
告诉 你 如 何 提高 重 现 问题 的 水 平 ， 或 者 在 软件 修复 中 学 到 的 知识 可 能 会 使 你 重新 考虑 你 的 诊断 
结果 。 





图 1-1 核心 调试 方法 


在 下 面 的 章节 中 ， 我们 将 详细 研究 这 些 步骤 。 而 在 此 之 前 先 来 了 解 一 些 基本 原则 。 
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1.4 先 澄清 几 个 问题 


径直 深入 讨论 可 能 更 诱 人 , 然而 还 是 值得 花 点 儿 时 间 来 说 说 一 些 基本 原则 , 以 确保 之 后 的 讲 
解 能 够 顺利 进行 。 


1.4.1 ”你 知道 要 找 的 是 什么 吗 


ETIT TETIT 在 开始 重 现 问题 或 者 推测 问题 产生 的 原因 之 前 ， 你 需 
A? 要 明确 地 了 解 到 底 发 生 了 什么 。 同 样 重要 的 是 ， 你 还 要 知 
What is happening, and what ” 道 正常 情况 下 应 该 发 生 什么 。 假 如 你 是 根据 一 份 正式 的 缺 
should? 陷 报告 来 工作 ， 那 么 这 个 报告 应 该 包含 了 所 有 你 需要 的 信 
息 。( 我 们 将 在 第 6 章 详细 讲解 缺陷 报告 。) 花 点 儿 时 间 仔细 阅读 一 下 ， 确 保 你 充分 理解 它 。 


假如 你 没有 正式 的 缺陷 报告 (可 能 你 正在 解决 一 个 备 感 困惑 的 缺陷 或 者 这 个 缺陷 是 在 不 经 意 
间 提 交 的 ) ， 那 么 更 应 该 先 暂停 你 的 工作 ， 要 确保 在 继续 工作 之 前 真正 地 了 解 整个 程序 。 


请 记 住 , 缺陷 报告 本 身 的 错误 不 会 比 其 他 文档 更 少 。 仅仅 是 因为 缺陷 报告 说 应 该 这 样 运行 而 
不 应 该 那样 运行 ， 就 能 真正 地 符合 软件 的 规格 说 明 书 吗 ? 如 果 它 没有 明确 地 说 明 应 该 怎样 运行 ， 
那么 在 你 彻底 弄 清 楚 之 前 不 要 做 任何 改变 一 一 否则 有 可 能 会 把 正确 的 改 为 不 正确 的 , 仅仅 听信 和 缺 
陷 报告 是 不 会 有 帮助 的 。 
不 要 轻信 缺陷 报告 
曾经 有 一 次 ， 我 修改 一 个 非常 简单 的 缺陷 一 一 生成 的 报告 说 程序 没有 考虑 夏令 时 
间 , 因此 当时 钟 变化 时 出 现 了 错误 。 我 快速 地 修复 了 此 缺陷 , 然后 转向 解决 下 一 个 问题 。 
然而 稍 后 出 现 了 另 一 个 缺陷 , 缺陷 是 账目 不 能 收 支 平衡 。 报告 生成 的 数量 与 我 们 从 
供应 商 那 里 得 到 的 发 票 的 数额 不 一 致 。 
EK, 事实 证 明 ， 这 些 票据 没有 考虑 夏令 时 间 ， 从 而 导致 了 差异 的 产生 。 再 查 以 前 
的 记录 发 现 ， 我 们 一 年 前 就 已 经 遇见 了 这 个 问题 ， 那 时 我 们 故意 忽略 了 夏令 时 间 。” 
显然 ， 这 个 问题 不 是 软件 没有 听 我 们 指挥 ， 而 是 我 们 自己 不 知道 想 让 软件 做 什么 。 
因为 报告 是 在 不 同 的 环境 下 使 用 的 ， 在 某 些 情况 下 ， 夏 令 时 间 是 需要 考虑 的 ， 而 另外 一 
些 情 况 下 ， 夏 令 时 间 是 不 需要 考虑 的 。 正 确 的 解决 办 法 是 在 报告 中 增加 选项 ， 允 许 用 户 
选择 。 





O 顺便 说 一 句 , 最 开始 对 源 程序 做 出 改变 的 开发 人 员 如 果 能 够 加 上 简单 的 代码 注释 ,说 明 为 什么 在 这 种 情况 下 忽略 
夏令 时 间 ， 让 我 们 明白 是 有 意 忽略 夏令 时 间 的 ， 就 会 减少 很 多 麻烦 。 
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1.4.2 一 次 一 个 问题 


有 时， 面 对 几 个 问题 时 往往 会 并 行 处 理 ， 这 似乎 挺 带劲 。 如 果 缺陷 都 发 生 在 同一 区 域 ,， 这 种 
做 法 尤其 常见 。 但 是 请 不 要 这 样 做 。 


调试 一 个 缺陷 已 经 很 困难 了 ,使 情况 更 为 复杂 是 没有 必要 的 。 无 论 怎 么 小 心 ,， 你 为 了 查找 一 
个 缺陷 所 进行 的 实验 很 有 可 能 会 以 某 种 方式 诱发 另外 的 缺陷 。 这 样 很 难 弄 清楚 究竟 发 生 了 什么 。 
此 外 (正如 我 们 4.5 节 所 讲 ) ， 你 最 终 要 签 人 修复 程序 时 ， 会 希望 每 做 一 次 逻辑 修改 就 签 人 一 次 ， 
而 如 果 你 同时 修改 多 个 缺陷 ， 那 么 这 就 很 难 实现 。 


有 了 时， 你 会 发 现 你 认为 一 个 缺陷 是 由 某 个 原因 3 引 1 起 的 ， 而 事实 上 它 却 是 由 多 个 原因 引起 的 。 


通常 情况 下 ， 当 你 处 于 思维 迟钝 的 状态 时 ,这 点 更 明显 一 一 奇怪 的 是 这 种 现象 似乎 没有 明确 的 解 
释 。 要 进一步 探讨 ， 你 可 以 参阅 3.4 刷 。 


1.4.3” 先 检查 简单 的 事情 
很 多 缺陷 是 由 于 简单 的 疏漏 而 引起 的 。 因 此 ， 有 时 你 会 面 对 非 常 微妙 的 事情 ， 但 请 千 万 不 要 
忽略 简单 的 事 。 


由 于 某 些 原因 ， 开 发 者 似乎 有 一 种 感觉 一 一 不 得 不 亲自 做 一 切 事情 。 在 NIH (Not-Invented- 
Here, FERRIE) 中 表现 得 最 为 明显 ， 这 种 感觉 使 得 我 们 想 要 自己 实现 程序 ， 但 其 实在 其 他 地 
方 已 经 存在 一 个 很 好 的 解决 方法 。 这 种 错误 的 观念 在 调试 方面 的 表现 就 是 你 必须 亲自 调试 你 遇 到 
的 每 一 个 问题 。 


问 问 团队 中 的 其 他 成 员 ， 是 否 以 前 也 遇 到 过 类 似 的 问题 ， 这 样 做 可 以 大 大 降低 成 本 ， 而 且 很 
有 可 能 避免 浪费 大 量 的 精力 。 如 果 你 工作 在 一 个 并 不 熟悉 的 领域 ， 这 样 做 尤其 重要 。 


Subversion 之 困惑 





骨 恩 。 埃 利 斯 

这 周 ， 我 的 一 个 新 伙伴 正在 受 SVN export 问题 的 困扰 。 这 是 一 个 致命 的 打击 一 一 服 
务 器 及 其 工作 站 拥有 相同 版 本 的 SVN， 但 是 状态 却 不 相同 ， 存 在 很 多 潜在 的 问题 。 

终于 ， 他 崩溃 了 。 他 问 我 ， 用 这 个 特有 的 命令 是 否 有 问题 ， 并 剪 切 粘贴 了 SVN 中 
的 命令 行 给 我 。 


‘EH, AFA.” 我 说 。Apache 库 中 有 这 样 的 缺陷 ， 在 路 径 中 用 ../.…/' .标记 是 
错误 的 。 两 秒 钟 后 ,我 们 确定 这 就 是 真正 的 问题 所 在 。 儿 分 钟 后 我 们 确定 了 服务 器 端 有 
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不 同 版 本 的 Apache 运行 时 DLL。 
当然 ， 几 个 月 前 很 多 潜在 的 问题 就 相继 发 生 ， 而 这 是 第 一 次 发 现 这 个 缺陷 。 


因此 ,沟通 总 是 重要 的 一 一 不 沟通 容易 陷入 奇怪 、 微 妙 、 令 人 生 厌 上 且 难 以 描述 的 方 
AY, HERA: “站 起 来 ， 间 问 是 否 有 人 以 前 见 到 过 此 类 问题 .” 


下 一 章 ， 我 们 将 详细 讲解 这 个 过 程 的 第 一 步 一 - 重 现 问题 。 
1.5 TRITZ 


O 一 定 要 做 到 以 下 几 点 。 

a 找到 软件 运行 异常 的 原因 。 

n 修复 问题 。 

se 避免 破坏 其 他 程序 。 

保持 或 提高 软件 整体 质量 。 

n 确保 不 在 其 他 地 方 发 生 同 样 的 问题 ， 确 保 这 种 问题 不 重复 发 生 。 
O 利用 软件 自身 来 告诉 你 发 生 了 什么 。 
O 每 次 只 解决 一 个 问题 。 

O 确保 你 知道 自己 要 找 的 是 什么 。 

a 正在 发 生 什 么 ? 

a 应 该 发 生 什 么 ? 

O 先 检查 简单 的 事情 。 


第 2 章 
重 现 问题 


正如 上 一 章 所 述 , 运用 实证 方法 进行 调试 可 以 充分 利用 软件 的 独特 能 力 , 来 告诉 你 软件 运行 
的 状态 ， 而 发 挥 这 种 能 力 的 关键 是 找到 能 够 重 现 问题 的 方法 。 


在 这 一 章 中 ， 我 们 将 介绍 以 下 内 容 : 
O 为 什么 重 现 问题 是 如 此 重要 ， 


O 如 何 对 你 的 软件 施加 必要 的 控制 ， 找 到 一 个 重 现 问题 的 方法 ; 
口 怎样 才能 做 好 问题 重 现 ， 以 及 如 何 通 过 反复 优化 来 达到 这 个 理想 目标 。 


2.1 重 现 第 一 ， 提 问 第 二 


为 什么 重 现 问 题 如 此 重要 ? 因为 如 果 你 不 能 重 现 问题 , 那 就 几乎 不 可 能 取得 进展 。 原 因 如 下 。 


口 实证 过 程 依赖 于 我 们 观察 存在 缺陷 的 软件 执行 的 能 力 。 我 们 应 该 首先 设法 使 软件 表现 出 
它 的 缺陷 ， 如 果 不 能 ， 那 么 这 就 如 同 我 们 丢失 了 军火 库 中 最 强大 的 武器 。 
o 即使 你 设法 提出 一 个 为 什么 软件 可 能 出 现 缺 陷 的 理论 ， 但 是 如 果 你 不 能 重 现 该 缺陷 ， 那 
么 又 如 何 证 明 你 的 理论 呢 ? 
如 果 你 认为 你 已 经 实施 了 软件 修复 ， 那 你 又 如 何 证 明确 实 解决 了 问题 呢 ? 
不 仅 重 现 问题 很 关键 ， 而 且 更 为 关键 的 还 在 于 这 是 你 应 该 做 的 第 一 件 事情 。 如 果 未 能 成 功 
地 重 现 该 问题 就 开始 修改 源 代码 ， 那 么 你 所 做 的 修改 可 能 会 掩盖 一 些 问 题 或 者 带 来 其 他 的 问 
题 。” 
那么 ， 究 竟 如 何 开始 这 个 调试 的 关键 阶段 呢 ? 


@ 这 类 似 于 测试 优先 开发 中 的 原则 ， 没 有 一 个 失败 的 测试 ， 你 就 不 应 该 写 任何 新 的 代码 。 在 这 种 里 ， 你 的 “失败 的 
测试 ”就 是 被 重 现 的 缺陷 。 
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2.1.1 明确 开始 要 做 的 事 


要 做 的 第 一 件 事 很 简单 ， 就 是 按照 缺陷 报告 描述 (或 提示 ) 的 步骤 来 做 。 


这 对 即使 是 只 有 一 行 的 缺陷 报告 也 同样 适用 。 我 曾经 看 到 开发 人 员 拒 绝 一 份 类 似 于 “取消 更 
改 密码 对 话 框 出 错 ” 的 缺陷 报告 ， 声 称 “ 需 要 更 多 的 信息 "， 甚 至 不 去 尝试 重 现 这 个 缺陷 。 虽 然 
我 们 都 曾经 为 缺少 关键 信息 的 缺陷 报告 感到 郁闷 ,但 有 些 错误 跟 你 运行 的 操作 系统 、 软 件 的 当前 
配置 .当时 运行 软件 时 做 了 些 什么 ,等 等 诸如 此 类 应 在 缺陷 报告 模板 中 包括 的 信息 其 实 关系 不 大 。 
有 时 候 打开 更 改 密码 对 话 框 , 然 后 点 击 取 消 , 该 软件 就 有 可 能 会 崩溃 ,这 样 你 就 可 以 马上 开始 诊 
断 ， 而 不 必 打 扰 用 户 来 获得 更 多 的 信息 。 就 算 查 不 出 问题 ， 也 不 会 浪费 你 很 多 时 间 。 


如 果 这 个 简单 的 方法 没有 效果 , 那么 缺陷 本 身 会 提供 一 些 有 用 的 线索 来 告诉 你 下 一 步 该 怎么 
做 。 
2.1.2 MEA 

要 做 好 问题 重 现 就 要 抓 好 控制 。 如 果 你 控制 了 所 有 相关 的 因素 ， 就 能 重 现 你 的 问题 。 当 然 ， 
方法 就 是 确定 哪些 因素 是 和 当前 缺陷 有 关 的， 你 要 如 何 去 设 置 它们 ， 并 找到 一 种 方法 去 实现 。 


作为 一 名 开发 人 员 , 你 的 环境 和 用 户 的 环境 是 不 同 的 。 你 使 用 的 是 最 新 的 源 代 码 ， 而 用 户 运 
行 的 可 能 是 在 几 周 、 几 个 月 其 至 是 几 年 前 编译 的 代码 。 你 的 配置 与 用 户 的 也 会 有 所 不 同 ， 你 的 网 
络 环境 、 使 用 的 外 设 等 都 可 能 不 一 样 ， 或 多 或 少 的 这 些 差异 会 妨碍 缺陷 的 重 现 。 因 此 ， 你 的 第 一 
个 任务 ， 就 是 找到 并 消除 这 些 差 异 。 

很 多 因素 可 能 会 悄然 地 影响 软件 的 运行 。 在 大 多 数 情 况 下 ， 它 们 之 间 是 很 少 相 关 的 。 那 么 怎 
么 知道 首先 应 该 集中 精力 解决 哪个 因素 呢 ? 

你 需要 控制 的 因素 可 以 归结 为 以 下 三 个 方面 ”。 

软件 本 身 ”如 果 缺 陷 存在 于 最 近 修 改 的 地 方 ， 那 么 你 应 该 首先 保证 你 调试 运行 的 软件 和 缺 
陷 被 提交 时 使 用 的 软件 是 同一 个 版 本 ， 因 为 这 是 保证 问题 重 现 的 起 码 要 求 。 

软件 的 运行 环境 如 果 要 与 外 部 系统 ( 某 些 特定 的 硬件 ， 或 者 一 个 远程 服务 器 ) 进行 交互 ， 
那么 可 能 需要 确保 你 使 用 的 是 相同 的 外 部 系统 。 

你 提供 的 输入 ”如 果 一 段 代 码 的 运行 情况 受 软件 的 配置 影响 很 大 ， 而 缺陷 又 与 这 段 代 码 有 


O 这 些 方面 之 间 的 界限 也 不 是 很 明确 -一 一 个 人 的 开发 环境 可 能 是 另 一 个 人 的 输入 环境 。 对 此 不 必 太 在 意 。 如 何 对 
你 需要 控制 的 因素 进行 分 类 是 无 关 紧要 的 ， 只 要 你 成 功 地 控制 就 可 以 了 。 
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关 ， 那 么 你 就 应 该 使 用 用 户 的 配置 来 进行 调试 。 
在 下 面 的 几 节 中 ， 我 们 将 详细 讲述 每 一 个 方面 。 


2.2 控制 软件 


如 果 你 使 用 最 新 的 源 代 码 而 不 是 用 户 正在 运行 的 版 本 , 无 法 迅速 地 重 现 缺 陷 , 这 当然 有 可 能 
是 因为 缺陷 已 经 被 修复 了 。 但 是 ， 你 不 能 做 出 这 种 假设 ， 因 为 很 有 可 能 缺陷 仍然 存在 ， 只 不 过 是 
以 另 一 种 不 同 的 形式 存在 。 只 有 当 你 已 经 完成 了 诊断 之 后 ,才能 确定 是 不 是 没有 缺陷 了 ， 而 诊断 
的 第 一 步 就 是 重 现 问题 。 


仅仅 通过 编译 同样 的 源 代码 并 不 能 保证 你 会 运行 同样 的 目标 代码 。 你 还 需要 确保 你 使 用 相同 
的 编译 器 ， 以 相同 的 方式 进行 配置 ， 使 用 相同 的 运行 时 环境 、 相 同 的 库 文件 ， 以 及 相同 的 集成 到 
你 软件 中 的 任何 第 三 方 代码 。 


当然 ， 即使 是 使 用 相同 的 工具 ， 如 果 你 不 准确 地 按照 执行 顺序 并 以 最 初 构建 软件 时 使 用 的 配 
置 来 使 用 它们 ,也 不 会 得 到 正确 的 结果 。 确保 你 做 得 正确 的 最 好 办 法 就 是 创建 一 个 自动 化 的 构建 
过 程 ， 我 们 将 会 在 9.3 节 中 详细 讨论 。 


2.3 ”控制 环境 


软件 环境 的 构成 取决 于 你 的 软件 类 型 。 对 于 传统 的 桌面 软件 ,操作 系统 可 能 是 最 相关 的 因素 ， 
对 于 Web 软件 ， 浏 览 器 可 能 是 最 相关 的 因素 ， 对 于 网 络 软件 ， 与 它 进行 通信 的 软件 可 能 是 最 相 
关 的 因素 ， 对 于 典 入 式 代 码 ， 它 所 使 用 的 硬件 可 能 是 最 相关 的 因素 。 


尽管 存在 这 些 差 异 ， 关 键 还 是 首先 要 知道 缺陷 出 现时 软件 所 使 用 的 环境 ， 我 们 将 在 6.1 节 中 
讨论 如 何 实现 这 个 目标 。 ME, 你 也 需要 方便 地 访问 所 有 可 能 的 环境 ,以 便 在 任何 一 个 相关 的 环 
境 中 进行 测试 。 ， 

一 些 人 有 幸 在 一 个 与 运行 环境 相同 (或 足够 类 似 ) 的 开发 环境 中 工作 , 这 意味 着 我 们 也 许可 
以 很 容易 地 在 开发 机 器 上 重 现 问题 。( 反 之 ， 如 果 一 切 都 在 我 们 开发 的 机 器 上 运行 ， 那 么 我 们 可 
以 确信 软件 部 署 后 会 很 好 地 工作 。) 但 是 ， 如 果 你 针对 多 个 平台 编写 媒人 式 软件 ， 或 者 在 笔记 本 
上 开发 而 在 服务 器 上 运行 ， 那 么 你 就 必须 想 办 法 来 构建 一 个 相同 的 运行 环境 。 


重 现 不 同 的 运行 环境 对 后 勤 部 门 来 说 曾 是 一 个 疆 梦 。 从 地 面 到 天 花 板 , 整个 房间 塞 满 了 不 同 品 
牌 型 号 的 计算 机 , 使 得 我 们 可 以 使 用 每 个 版 本 的 硬件 和 操作 系统 , 这 样 的 软件 开发 场所 一 度 也 很 党 
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见 。 有 两 件 事情 在 很 大 程度 上 帮助 我 们 解决 了 这 个 问题 。 第 一 个 就 是 硬件 抽象 一 一 计算 机 图 形 卡 可 
能 大 大 影响 软件 运行 的 日 子 已 经 一 去 不 回 了 ， 谢 天 谢 地 。" 第 二 个 就 是 虚拟 机 一 一 几乎 不 用 费力 就 
可 以 在 一 台 计 算 机 上 同时 运行 很 多 的 操作 系统 和 进行 不 同 的 配置 .如 果 你 正在 使 用 的 是 跨 平台 的 软 
件 ， 那 么 虚拟 机 的 作用 会 非常 明显 ， 它 在 其 他 应 用 环境 下 也 是 很 有 用 的 。 


例如 ， 你 正在 编写 Web 软件 ， 可 能 需要 支持 各 种 浏览 器 ， 而 且 可 能 每 个 浏览 器 都 有 几 个 不 

同 的 版 本 。 实 现 这 一 目标 的 最 简单 方法 (特别 是 在 单一 操作 系统 上 安装 多 个 浏览 器 的 多 个 版 本 是 

很 有 难度 的 ) 可 能 是 使 用 若干 个 不 同 的 虚拟 机 ， 每 个 虚拟 机 配置 一 个 不 同 的 操作 系统 和 浏览 器 。 
另 一 个 例子 是 , 你 正在 编写 一 个 要 同时 运行 在 多 台 计算 机 上 的 软件 一 “你 的 软件 可 能 需要 被 

部 署 到 一 组 机 器 中 ? 如 果 是 这 样 ， 你 可 以 在 一 台 开发 用 的 机 器 上 并 行 地 运行 几 个 虚拟 机 ， 从 而 创 
RARE TRB wR 。 建 “人 “虚拟 数据 中 心 。 


PESO R AGH. 最 后 ， 请 记 住 ,软件 环 境 包 括 了 可 能 影响 软件 运行 的 
is anpthing thet might arot 。 所 有 因素 。 有 时 ， 如 下 面 的 故事 所 述 的 ， 可 能 会 包括 一 些 
its behavior. 我 们 认为 不 可 能 的 因素 。 

MEARE MIR 


Dave 的 工作 是 为 打印 机 设备 编写 驱动 程序 。 经 过 几 个 星期 的 工作 ， 他 党 得 程序 已 
经 编写 完成 ,就 把 它 交 给 楼 上 的 测试 人 员 进 行 测试 。 Rik, 测试 人 员 发 现 了 一 个 间 欣 性 
缺陷 一 一 在 输出 中 出 现 虚 的 水 平 线 。 

想 尽 一 切 办 法 ，Dave 还 是 没 能 重 现 该 问题 。 他 一 页 一 页 打印 ， 没 有 找到 一 处 这 样 
的 错误 。 我 们 开始 寻找 开发 环境 和 测试 环境 的 差异 ， 但 也 没有 任何 效果 。 我 们 甚至 把 整 
个 测试 系统 从 楼 上 搬 到 楼 下 。 我 们 选择 了 一 个 能 够 重 现 问 题 的 系统 ， 几 个 人 沿 一 级 级 台 
阶 把 它 搬 到 楼 下 一 一 可 是 它 的 运行 没有 任何 问题 。 

Dave 认为 缺陷 是 由 一 群 住 在 楼 上 的 精灵 造成 的 ， 他 们 干扰 了 打印 机 的 内 部 工作 。 
令 人 诺 异 的 是 ， 结 果 他 的 想法 被 证 明 是 最 接近 事实 的 。 


我 们 的 办 公 室 位 于 剑桥 那 乡村 ， 是 一 个 非常 好 但 又 古老 的 房子 。 这 是 一 个 工作 的 好 
地 方 ， 但 有 它 的 缺点 。 其 中 一 个 缺点 就 是 它 的 线路 问题 这些 线路 虽然 不 像 房 子 那 么 古 
老 ， 但 是 比 大 多 数 工 作 人 员 的 年 纪 都 大 。 原 来 ， 楼 上 电力 系统 配置 得 不 是 很 好 ， 电 压 的 
随机 波动 足以 导致 我 们 得 到 不 同 的 运行 结果 。 


` O 除了 少数 专业 领域 以 外 ， 比 如 游戏 。 
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2.4 控制 输入 
软件 的 输入 数据 可 能 是 磁盘 上 的 文件 、 一 系列 的 用 户 界面 操作 , 或 者 是 来 自 第 三 方 服务 器 或 
设备 的 响应 。 无 论 何 种 形式 的 输入 ， 关 键 是 要 首先 找 出 输入 数据 ， 以 便 你 准确 地 重 放 它们 。 


如 果 你 运气 好 , 相关 的 输入 将 被 明确 地 记录 在 缺陷 报告 中 , 但 情况 并 非 总 是 如 此 。 对 你 来 说 ， 
一 个 缺陷 报告 需要 列 出 运行 过 程 中 的 每 一 个 步骤 ， 但 你 的 客户 不 太 可 能 认识 到 这 样 做 的 重要 性 。 
或 者 他 们 可 能 会 在 描述 中 加 入 他 们 自己 的 先入 之 见 ( 而 这 种 意见 可 能 与 实际 运行 的 状况 相去 
甚 远 ) 。 


即使 用 户 认 认真 真 地 汇报 他 们 所 做 的 一 切 ， 仍 然 可 能 是 不 够 的 。 通 常 对 于 最 终 用 户 而 言 ， 很 
多 重要 的 细节 不 那么 显而易见 ， 甚 至 根本 无 法 获得 。 例 如 ， 该 缺陷 可 能 是 由 细微 的 时 间 差 异 导致 
的 ， 或 者 是 由 后 台 接收 第 三 方 系统 的 输入 而 产生 的 。 


如 果 你 无 法 获得 需要 的 所 有 信息 ,就 有 两 种 选择 。 或 者 推测 一 下 可 能 的 输入 是 什么 , 或 者 把 
它们 记录 下 来 。 


2.4.1 推测 可 能 的 输入 

推测 正确 的 输入 来 重 现 问题 的 出 发 点 是 假设 问题 确实 存在 , 然后 运用 逆向 工程 的 方法 推测 出 
能 够 导致 问题 的 必要 条 件 。 

1. 回溯 工作 

通常 我 们 知道 发 生 了 什么 事 ， 但 并 不 很 清楚 为 什么 会 发 生 。 


例如 ,我们 有 一 个 缺陷 报告 ， 指 出 了 程序 因为 一 个 空 引用 而 崩溃 。 我 们 可 以 从 错误 信息 得 知 
哪 一 行 源 代 码 发 生 了 空 引用 ， 但 我 们 不 知道 程序 以 什么 顺序 执行 到 这 一 行 。 


我 们 所 能 做 的 就 是 回溯 我 们 的 工作 。 我 们 可 以 推断 ， 如 果 变 量 a 在 那 行 代码 中 是 空 的 ,那么 
就 必然 意味 着 一 个 不 存在 的 标识 符 被 传递 给 方法 bO, 而 这 又 意味 着 必须 使 用 特定 的 输入 值 来 调 


如 果 你 运气 好 , 这 个 逻辑 可 以 直接 重 现 问题 。 即使 不 能 完全 重 现 , 它 也 可 以 提供 有 用 的 线索 ， 
再 加 上 其 他 的 异常 现象 ， 就 可 以 排除 某 些 可 能 性 。 


2. 探测 可 能 的 输入 值 
即使 缺陷 报告 中 的 一 系列 的 输入 不 能 重 现 问题 ， 但 与 它们 相 类 似 的 输入 极 有 可 能 会 重 现 问 
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题 。 可 能 缺少 某 一 个 重要 的 步骤 ， 或 者 他 们 说 点 击 了 那个 按钮 ， 但 实际 上 却 是 点 击 了 这 个 按钮 。 
在 这 种 情况 下 ， 你 可 以 通过 查看 报告 中 的 相似 步 又 来 找到 正确 的 执行 顺序 。 


在 这 里 ， 你 熟悉 的 很 多 软件 测试 技术 将 会 派 上 用 场 ， 特 别 是 边界 值 分 析 法 和 分 支 覆 盖 法 。 


边界 值 分 析 ”经验 表明 ， 输 入 值 取 值 范围 的 边界 是 最 有 可 能 出 现 错误 的 地 方 。 如 果 你 的 软 
件 应 该 在 输入 值 为 10 以 下 时 做 一 件 事情 ， 而 为 11 或 以 上 做 另 一 件 事 情 ， 那 么 当 你 输入 10 或 11 
时 就 极 有 可 能 会 出 现 错误 。 其 他 常见 的 边界 条 件 是 长 度 为 零 的 输入 值 , 或 者 从 正 数 变 为 负数 的 输 
入 值 。 


分 支 覆 盖 ”分支 覆盖 相当 于 白 盒 测 试 中 的 边界 值 分 析 (边界 值 分 析 是 黑 盒 技术 )。 "如 果 你 
不 能 通过 一 系列 的 输入 来 重 现 问题 , 那么 可 以 尝试 创建 一 些 输入 , 使 用 这 些 输入 可 以 米 盖 同一 代 
码 块 中 的 不 同 分 支 。 


有 效 地 识别 能 重 现 问 题 的 输入 顺序 需要 你 转变 思路 一 一 你 不 必 证 明 系统 工作 正常 , 而 要 证 明 
它 不 正常 。 


还 有 其 他 的 方向 


在 《程序 员 修炼 之 道 》[HT00] 中 ，Andy 讲述 了 一 个 同事 的 故事 ， 他 在 竭尽 全 力 重 
现 图 形 应 用 程序 中 出 现 的 问题 。 缺 陷 报 告 说 ,每 当 使 用 一 种 特定 的 画笔 在 屏幕 上 划一 笔 
时 ， 软 件 就 崩溃 了 ， 但 是 他 坚定 地 认为 一 切 运行 良好 。 


儿 天 后 ， 大 家 慢 慢 冷静 下 来 。 他 们 最 终 发 现 ， 每 当 他 “测试 ”画笔 时 ， 他 总 是 从 左 

下 的 位 置 划 到 右上 的 位 置 ( 换 外 话说 ， 同 时 增加 x 和 yy 的 坐标 )。 而 当 他 向 另 一 个 方向 

划 时 ， 立 刻 就 出 现 了 问题 。 

3. 利用 错误 条 件 

编写 代码 时 ， 人 们 往往 会 将 精力 集中 在 进展 顺利 的 方面 , 这 是 人 的 天 性 。 我 们 心里 有 一 个 特 
定 的 目标 , 而 且 往 往 集中 精力 去 实现 这 个 目标 ,而 不 操心 那些 可 能 导致 错误 发 生 的 方法 。 加 之 测 
试 错误 条 件 可 能 很 麻烦 ， 结 果 就 是 错误 条 件 可 能 诱发 一 系列 缺陷 。 

当 试图 重 现 一 个 问题 的 时 候 ， 考虑 一 下 是 否 有 一 些 错误 条 件 出 现在 运行 的 过 程 中 , 并 去 解释 
为 什么 问题 会 发 生 。 然 后 ， 想 想 如 何 使 错误 条 件 表现 出 来 或 者 模拟 出 来 ， 并且 是 否 可 以 使 你 重 现 
问题 。 


D BREA, 不必 了 解 测试 系统 的 内 部 结构 就 可 以 得 到 测试 用 例 。 与 此 相反 ， 白 盒 技术 会 利用 对 系统 内 部 结构 的 了 
解 来 创建 测试 用 例 。 
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4. 引入 随机 性 


选取 一 系列 不 同 输入 值 的 一 种 方法 就 是 引入 一 些 随 机 输入 值 。 比 如 ， 如果 你 寻找 一 个 似乎 依 
赖 于 时 序 细节 的 缺陷 ， 那 么 把 随机 输入 值 引入 其 中 会 大 大 增加 缺陷 出 现 的 机 会 。 


模糊 测试 包括 为 程序 提供 随机 数据 (或 称 模糊 )， 一 个 模糊 测试 器 可 以 使 调试 过 程 自动 进行 
( 见 A.4 节 )。 模 糊 测 试 器 要 么 通过 生成 模糊 器 要 么 通过 变异 模糊 器 生成 模糊 数据 。 


生成 模糊 器 ”生成 模糊 器 利用 一 个 数据 模型 生成 输入 值 ， 它 使 用 新 的 数据 或 者 按 某 些 方式 
将 已 有 数据 组 合 起 来 。 这 种 数据 模型 融合 了 对 被 测试 软件 的 理解 ， 可 以 提高 发 现 问 题 的 几率 。 


变异 模糊 器 ”变异 模糊 器 是 由 一 个 熟知 的 、 可 以 根据 一 系列 规则 进行 修改 的 模板 生成 的 。 
这 些 规则 的 出 发 点 是 要 增加 根据 结果 输入 来 揭示 缺陷 的 能 力 。 


所 有 模糊 测试 器 的 一 个 关键 特征 是 ,它们 可 以 重新 创建 任何 曾经 生成 的 输入 , 以 便 问题 出 现 
时 ， 能 够 随意 重 现 问 题 。 


在 推测 重 现 问 题 时 需要 使 用 的 数据 的 过 程 中 , 请 记 住 你 需要 验证 与 缺陷 报告 不 符 的 结论 。 你 
找到 了 一 种 使 软件 出 现 缺 陷 的 方法 , 并 不 意味 着 你 找 出 了 缺陷 报告 中 提 到 的 缺陷 (尽管 你 已 经 清 
楚 地 发 现 了 一 个 需要 修正 的 缺陷 )。 


24.2 ”记录 输入 值 


推测 正确 的 输入 以 重 现 问题 的 另 一 种 选择 , 是 通过 日 志 来 直接 记录 输入 值 。 如 果 你 的 软件 已 
经 内 置 了 日 志 功 能 ， 那么 就 可 以 很 简单 地 让 用 户 打开 日 志 功 能 并 把 结果 发 送 给 你 。 或 者 ,你 可 以 
给 他 们 发 送 一 个 自 定义 的 软件 或 者 其 他 一 些 日 志 解 决 方案 (例如 一 个 调试 程序 或 代理 程序 )。 不 
管 你 决定 采用 哪 种 解决 方案 ， 都 应 准确 了 解 用 户 真实 的 操作 ， 这 是 最 有 价值 的 。 


1. 日 志 


获得 日 志 的 最 简单 方法 就 是 ， 在 整个 代码 中 正确 地 放置 对 System.out.println() 或 类 似 方 
法 的 调用 。 事实 上 , 这 种 简单 的 方法 可 能 会 满足 你 所 有 的 需求 。 但 是 如 果 你 的 日 志 需 求 确实 十 分 
复杂 ， 你 就 应 该 考虑 从 诸多 可 用 的 日 志 框 架 中 选择 一 个 使 用 ( 见 A.3 节 )。 


日 志 框架 可 以 免费 为 你 提供 大 量 有 用 的 功能 。 


O 能 够 在 需要 的 特定 地 方 打开 或 关闭 日 志 功 能 。 
O 不 同 的 日 志 级 别 ， 能 使 你 对 生成 的 日 志 数 量 进行 微调 。 在 正常 运行 期 间 ， 或 许 你 只 记录 
了 软件 发 生 致 命 错误 时 的 日 志 ， 或 者 仅仅 大 概 记录 了 软件 能 够 做 什么 而 设 有 任何 的 细节 。 
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但 是 当 你 需要 的 时 候 ， 你 可 以 提高 日 志 的 级 别 来 生成 更 多 的 信息 ， 甚 至 可 以 精确 地 记录 
哪些 函数 被 调用 了 ， 是 在 什么 时 候 被 调用 的 ， 传 递 了 哪些 参数 。 

Q 日 志 信息 可 以 包含 很 多 非常 有 用 的 信息 ， 比 如 这 些 信 息 与 哪个 日 志 级 别 或 模块 有 关 ， 其 
至 可 以 精确 地 获得 源 文件 的 行 数 。 

a 可 以 帮助 分 析 日 志文 件 的 标准 工具 。 

口 自动 记录 某 些 事件 ， 比 如 未 处 理 的 异常 。 


实际 中 是 如 何 使 用 日 志 框 架 的 呢 ? 下 面 是 一 个 使 用 java.uti1.1ogging 框架 的 Java 类 的 例 
子 。 
import java.util. logging.Logger; 


public class Dispatcher { 
o private static final Logger log = Logger.getLogger(Dispatcher.class.getName()); 


public static void dispatchLoop() { 
while(true) { 
try { 
long start = System.currentTimeMillisQ); 


Item item = WorkQueue.getNextItem(); 
© log.fine("Processing item: ”+ item); 


item.process(); 


long timeInMillis = System.currentTimeMillis() - start; 


© 1og.info("Processing ”+ item + ”took ”+ timeInMillis + "ms"); 
} catch(Exception e) { 
o log.severe("Unhandled exception: ”+ e); 
} 
} 
} 
} 


在 @ 处 ， 我 们 创建 了 一 个 Logger 实例 ， 并 把 类 名 作为 参数 传递 给 它 。 这 不 仅 可 以 自动 地 用 
类 名 来 注解 我 们 的 日 志 信息 , 而 且 可 以 使 我 们 把 这 里 生成 的 日 志 信息 与 其 他 地 方 生成 的 日 志 信 息 
区 分 开 来 。 在 @@ @ 处 ,我们 以 不 同 的 日 志 级 别 (分别 是 良好 级 、 信 息 级 和 服务 级 ) 生成 日 志 
信息 , 到 底 输 出 哪个 级 别 的 信息 取决 于 我 们 如 何 进 行 配 置 一 一 也 许 正常 情况 下 我 们 只 需要 输出 警 
告 (WARNING) 及 以 上 级 别 的 信息 ， 但 是 在 调试 一 个 程序 的 时 候 ， 是 不 是 应 该 把 日 志 级 别 降低 
到 最 细微 (FINEST) 级 别 ? 


我 们 一 直 在 讨论 如 何在 准确 地 识别 输入 值 以 重 现 问题 的 情况 下 使 用 日 志 , 但 其 实 日 志 也 可 以 
用 在 更 广泛 的 环境 中 ， 请 看 下 面 的 讨论 。 
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Y 小 乔 爱 问 


~ 


过 ”我 应 该 把 日 志 留 在 代码 中 吗 
有 些 议题 在 开发 者 之 间 一 定 会 引起 争论 ， 日 志 就 是 其 中 之 一 。 


如 果 你 为 了 进行 问题 跟踪 ， 已 经 在 代码 中 添加 了 日 志 功 能 ,那么 就 应 该 把 它 放 到 合适 的 
地 方 ,以 便 以 后 问题 再 次 发 生 时 能 很 快 地 找到 它 。 如 果 你 使 用 的 是 可 以 很 容易 启用 和 禁用 日 
志 功 能 的 日 志 框架 ， 那 么 这 么 做 就 更 正确 了 。 这 样 不 好 吗 ? 


那么 ， 为 什么 会 有 争论 呢 ? 批评 者 会 告诉 你 以 下 几 点 。 


口 日 志 会 使 代码 变 得 难以 理解 ， 使 你 只 见 树木 不 见 森 林 。 

口 日 志 可 能 会 遇 到 与 注释 一 样 的 问题 一 一 日 志 代码 并 不 随 着 代码 的 更 新 而 更 新 ， 这 意 
味 着 你 不 能 相信 上 日志 记 录 的 内 容 ， 这 会 使 情况 变 得 比 不 用 日 志 更 糟 。 

口 无 论 你 添加 多 少 日 志 功 能 ， 它 都 是 你 不 需要 的 。 下 一 次 你 在 同样 的 地 方 进 行 调试 ， 
还 必须 添加 更 多 的 日 志 。 如 果 完 成 工作 之 后 还 把 日 志 功能 留 在 代码 中 ， 那 么 你 只 会 
使 前 两 个 问题 变 得 更 加 复杂 。 


对 于 此 类 问题 的 大 多 数 争论 ,我 们 的 答案 是 要 注重 实效 。 日志 是 一 种 很 有 用 的 工具 ， 但 
它 可 能 被 过 度 使 用 。 如 果 你 认为 它 确实 有 价值 ， 可 以 考虑 一 直 使 用 日 志 功 能 ， 但 必须 经 过 
相关 的 训练 。 请 确保 你 的 日 志 是 随时 更 新 的 ， 与 代码 保持 一 致 ， 并 且 不 会 为 了 日 志 而 做 日 
E 


So 


一 般 来 说 ， 最 有 用 的 日 志 是 在 最 高 (战略 ) 级 一 记录 发 生 的 一 切 ， 例 如 由 HTTP 服务 
器 生成 的 访问 日 志 。 低级 别 的 、 更 战术 性 的 日 志 不 一 定 有 长 期 价值 ， 因 此 要 确切 知道 添加 日 
志 之 后 它 会 给 你 带 来 什么 。 

如 果 发 现 日 志 会 妨碍 你 的 工作 , 但 又 不 想 失 去 使 用 它 的 好 处 , 你 可 能 应 该 了 解 一 下 面向 
方面 的 程序 设计 , 它 会 提供 给 你 将 日 志 从 主 代码 中 分 离 的 方法 (一 本 好 的 参考 书 是 AspectJ in 
Action (Lad03) ) 。 





即将 引爆 的 定时 炸弹 

当 我 写 这 一 章 的 时 候 ， 部 署 我 们 的 应 用 程序 的 服务 器 群集 出 现 了 一 个 硬件 故 
障 一 一 一 个 SAN (Storage Area Network， 存 储 区 域 网 ) 系统 突然 将 所 有 驱动 器 都 标识 出 
现 了 故障 。 我 们 可 以 十 分 肯定 不 可 能 所 有 的 驱动 器 同时 出 故障 ， 因 此 显然 SAN 系统 本 
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身 出 了 问题 。 


令 人 欣慰 的 是 ， 出 现 问题 的 系统 存 有 日 志 记录 ， 供 应 商 可 以 使 用 它 来 确认 一 个 每 
49.7 天 就 出 现 一 次 的 时 间 窗 口 。 利 用 3 天 内 的 输出 信息 ,他们 诊断 出 了 故障 并 打 了 补丁 。 
如 果 没 有 日 志 记 录 ， 他们 就 会 面 对 一 个 莫名 其 妙 的 故障 ,必须 花费 大 量 的 时 间 去 尝试 着 
重 现 这 个 问题 (至 少 需要 49 天 ， 直 到 那个 窗口 再 次 打开 为 止 ， 甚 至 可 能 需要 更 长 的 时 
间 ， 因 为 无 法 保证 故障 一 定 会 发 生 )。 通 过 抓 取 系统 接收 的 输入 值 的 关键 信息 和 其 内 部 
的 状态 ， 他 们 可 以 大 大 缩短 整个 流程 ,在 我 们 的 系统 再 次 出 现 问题 之 前 就 实施 和 安装 修 
复 程 序 。 


2. 外 部 日 志 


把 日 志 功能 直接 添加 到 软件 中 不 是 你 唯一 的 选择 , 还 可 以 通过 拦截 你 的 软件 和 其 他 软件 间 的 
流量 ， 从 软件 外 部 获取 很 多 有 用 的 信息 。 


例如 , 你 的 软件 通过 网 络 与 另 一 个 软件 系统 通信 , 你 可 以 在 两 个 系统 之 间 插 入 一 个 日 志 代理 ， 
如 图 2-1 所 示 。 如 果 日 志 代理 不 支持 你 正在 使 用 的 协议 ， 或 者 你 无 法 找到 配置 方法 来 使 日 志 代理 


拦截 流量 ,那么 可 以 考虑 使 用 网 络 分 析 器 来 捕获 所 有 网 络 流 量 。 你 可 以 在 A.4 节 中 找到 这 些 工具 
的 使 用 方法 。 


产品 





图 2-1 日 志 代理 


这 种 方法 并 不 仅 限于 网 络 通信 。 如 果 你 的 软件 通过 API 与 一 个 第 三 方 库 文件 通信 , 你 也 许 能 


2.4 控制 输入 A 19 


够 创建 一 个 位 于 你 的 软件 和 库 文件 之 间 的 中 间 程 序 (shim), ° 来 拦截 它们 之 间 的 通信 。 这 个 中 间 
程序 能 够 链接 到 库 文件 并 输出 相同 的 API， 在 记录 日 志 时 能 够 逐条 地 转发 所 有 的 调用 。 


你 可 能 还 发 现 ， 正 在 集成 的 系统 已 经 提供 了 足够 多 的 支持 。 例 如 ， 你 正在 编写 一 个 Web 应 用 
程序 ， 而 应 用 服务 器 已 经 实现 了 细致 又 全 面 的 日 志 功能 。 


2.4.3 ”负载 和 压力 


有 一 些 缺 陷 只 有 当 软 件 在 某 种 压力 下 运行 时 才能 表现 出 来 . 这 可 能 是 因为 软件 本 身 也 必须 做 
一 些 事情 〈 比 如 ， 处 理 大 量 同 时 发 出 的 请 求 或 特别 大 的 数据 集 )， 也 可 能 因为 运行 环境 中 的 某 些 
因素 引起 的 〈 例 如 高 负载 的 网 络 流量 或 有 限 的 可 用 内 存 )。 


由 于 一 些 显而易见 的 原因 , 我 们 很 难 重 现 这 种 负载 对 这 类 缺陷 进行 调试 一 一 因为 我 们 很 少 能 
够 拥有 含 成 千 上 万 测试 人 员 的 测试 部 门 ， 去 严阵以待 地 重 现 高 负载 的 软件 应 用 。 


一 个 负载 测试 工具 会 执行 一 段 脚 本 , 这 段 脚本 可 以 或 多 或 少 地 模拟 真实 的 应 用 。 你 可 以 通过 
调整 配置 让 它 按照 你 的 需要 来 创建 尽 可 能 多 的 并 发 会 话 (如果 一 个 客户 端 不 够 用 ,那么 可 能 会 
同时 运行 在 多 个 客户 端 机 器 上 )， 去 重 现任 何 你 需要 的 负载 级 别 ”。 


关于 负载 测试 工具 的 问题 , 通常 是 找到 一 个 办 法 让 它们 重 现 真实 的 负载 。 创 建 大 量 简单 的 交 
互 行为 是 非常 容易 的 , 但 是 那样 可 能 并 不 会 产生 足够 真实 的 负载 来 重 现 你 要 调试 的 问题 。 解决 的 
方法 之 一 是 使 用 日 志 记 录 真 实 的 负载 县 ， 然 后 使 用 负载 测试 工具 去 重 现 它 。 


压力 测试 工具 也 是 类 似 的 ， 只 不 过 它们 不 直接 产生 负载 。 例 如 ， 在 软件 的 运行 过 程 中 你 
可 以 使 用 一 个 压力 测试 工具 来 分 配 和 收回 大 量 的 内 存 资源 ， 或 者 大 量 地 占用 CPU 的 运行 时 
间 。 


你 可 以 在 A.4 节 中 找到 一 些 热门 的 负载 测试 工具 的 使 用 方法 。 


重 现 问题 曾经 是 一 个 重要 的 障碍 一 一 毫 无 疑问 ， 你 现在 正在 跟踪 一 个 真正 的 缺陷 , 你 已 经 向 
诊断 之 路 迈 出 了 非常 重要 的 一 步 。 但 是 有 一 些 有 用 的 或 者 还 算 有 用 的 方法 去 重 现 缺陷 。 在 下 一 节 ， 
我 们 将 看 看 如 何 改进 你 的 问题 重 现 ， 使 之 尽 可 能 地 有 效 。 


D 在 工程 学 中 , 中 间 程序 是 一 块 用 来 填充 不 同 物体 之 间 空 阶 的 薄片 。 在 计算 机 领域 我 们 借用 这 个 词 来 表示 一 个 位 于 
大 的 库 文件 和 它 的 客户 端 代码 之 间 的 小 的 库 文件 。 它 可 用 于 将 一 个 API 转 换 成 另 一 个 API, 或 者 像 我 们 在 这 里 讨 
论 的 那样 ， 只 需 增加 少量 的 功能 而 不 必修 改 主 库 文件 本 身 。 

© 最 近 可 供 使 用 的 云 计 算 平 台中 ， 亚 马 逊 的 弹性 计算 云 (EC2) 平台 可 能 是 最 有 名 的 ， 它 允许 大 量 的 客户 端 进行 负 
载 和 压力 测试 ， 比 以 前 方便 很 多 。 


20 > 第 2 章 ， 重 现 问题 
2.5 ”改进 问题 重 现 


不 管 是 什么 样 的 重 现 问题 的 方法 ， 只 要 有 就 比 没有 强 。 但 是 你 想 让 重 现 问题 既 可 靠 又 方便 。 
在 诊断 期 间 你 将 不 得 不 一 遍 又 一 遍地 反复 地 进行 问题 的 重 现 , 所 以 你 需要 能 够 按 需 去 做 ,并 且 代 
价 最 小 。 


2.5.1 最 小 化 反馈 周期 


当 运 行 实验 来 追踪 你 要 调试 的 错误 时 , 一 个 重要 的 原则 是 这 些 实验 要 尽 可 能 地 有 效 。 如 果实 
现 完全 可 靠 的 问题 重 现 需要 运行 1 小 时 以 上 , 或 者 需要 你 按照 正确 的 顺序 执行 50 个 不 同 的 动作 ， 
那么 这 样 做 也 是 效率 低下 的 。 


你 要 达到 的 目标 是 使 你 创建 的 “编辑 -编译 -执行 - 重 现 问题 ”的 周期 最 短 ， 错 误 最 少 。 你 希 





Soee. 问题 的 所 有 方面 (并 最 终 测试 可 能 的 解决 方法 )。 

You want to be able to run lots 和 软件 开发 的 其 他 众多 领域 一 样 ， 问 题 重 现 也 是 要 使 
of experiments quickly. _ 反馈 周期 最 小 。 所 经 过 的 周期 越 短 ， 反 馈 就 越 及 时 ， 其 相 
关 性 也 越 高 。 


如 果 周 期 较 长 ， 可 能 会 面临 一 个 真正 的 风险 ,这 就 是 你 会 发 现 自己 得 要 一 次 做 出 多 个 修改 
一 一 当 讨论 问题 诊断 的 时 候 我 们 会 看 到 ， 多 个 同步 的 变化 将 会 导致 各 种 问题 。 


1. 尽 可 能 简单 





第 一 次 重 现 问题 就 能 做 到 最 小 化 是 不 太 可 能 的 。 换 句 


hb E R: 话说 ， 相 比 所 需 的 精简 要 求 ， 它 可 能 要 复杂 得 多 ， 因 此 你 
ct ”ine TEPO 最 先 要 关注 的 就 是 找 出 问题 重 现 中 哪些 方面 是 不 必要 的 ， 
并 把 它们 别 除 掉 。 


例如 ， 你 的 软件 读 取 XML 文件 ， 而 且 你 已 经 可 以 确定 该 软件 读 取 一 个 包含 100 个 标签 的 文 
件 时 就 会 崩溃 。 那 么 有 一 个 很 大 的 可 能 性 ， 就 是 你 不 需要 读 取 整 个 文件 就 能 重 现 该 问题 。 如 有 果 它 
在 读 取 到 一 个 特定 的 标签 时 崩溃 , 那么 是 否 只 需要 一 个 包含 这 个 特定 标签 的 文件 就 可 以 了 ? 或 者 
在 它 周围 仅仅 需要 多 几 个 标签 就 可 以 了 ? 


它 可 能 没有 那么 简单 一 有 可 能 是 位 于 文件 前 面 的 东西 创建 了 适合 的 上 下 文 或 那个 标签 , 从 
而 导致 了 缺陷 的 发 生 。 然 而 ， 你 可 能 会 发 现 大 部 分 的 文件 内 容 可 以 不 用 考虑 。 





2.5 改进 问题 重 现 A 21 


问题 重 现 中 的 哪些 元 素 可 以 被 别 除 掉 ? 往往 多 相信 直觉 。 你 了 解 软件 ,并且 知 道 哪 些 模 块 可 
能 被 一 些 特定 的 输入 所 影响 ， 哪 些 不 会 被 影响 。 如 果 你 的 直觉 不 对 ， 那 么 一 些 非 直接 的 方法 可 能 
会 产生 奇效 。 


假设 你 有 一 个 包含 100 行 代码 的 输入 文件 ,而 且 你 并 不 清楚 文件 中 的 哪 一 行 出 了 问题 。 那 么 
你 可 以 使 用 一 种 很 简单 的 方法 ， 就 是 先 把 文件 的 后 半 部 分 删除 ， 看 它 是 否 仍然 能 够 重 现 门 题 。 如 
果 是 ， 显 然 你 就 可 以 把 问题 定位 在 文件 的 上 半 部 分 ， 如 果 不 是 ， 请 删除 文件 的 前 半 部 分 ， 你 可 能 
会 发 现 文件 的 后 半 部 分 还 存在 缺陷 。 这样 反复 若干 次 后 , 你 就 可 以 迅速 地 将 文件 压缩 成 只 有 几 行 
代码 。 同 样 的 方法 可 以 适用 于 任何 类 型 的 输入 (通过 用 户 界面 进行 的 操作 ， 从 硬件 得 到 的 响应 ， 
等 等 )。 





自动 地 最 小 化 输入 
事实 证 明 , 重 现 问 题 中 让 需要 的 输入 值 最 少 , 是 可 以 通过 自动 化 的 方式 进行 的 Andreas 
Zeller 在 《代码 之 美 》 这 本 书 中 讨论 了 一 种 可 以 达到 这 个 目标 的 方法 (通过 自动 化 二 分 | 
法 )。 








就 我 个 人 而 言 ,我 从 未 看 到 这 种 方法 在 手工 状态 下 使 用 , 但 是 它 确实 是 一 种 非常 智慧 的 
方法 。 也 许 它 指明 了 一 个 工具 支持 的 未 来 发 展 方向 ? 





这 种 方法 是 二 分 法 的 一 个 特例 , 是 在 大 规模 的 调试 场景 中 非常 有 效 的 一 种 查询 算法 。 我 们 将 
在 3.2 节 中 进一步 讨论 这 个 问题 。 


年 轻 的 活力 

在 博士 研究 期 间 , 我 有 幸 能 够 在 微软 公司 的 编译 器 和 工具 小 组 做 夏季 实习 。 我 的 工 
作 是 开发 代码 查看 调试 器 ， 并 在 此 过 程 中 发 现 了 一 个 未 发 行 的 C 编译 器 中 存在 缺陷 。 

我 认为 这 是 很 有 责任 心 并 且 非 常 有 帮助 的 事 ， 于 是 提交 了 一 份 缺 陷 报告 ， 其 中 包 
括 完 整 的 源 文件 的 预 输出 值 (处 理 完 所 有 的 #include 指令 之 后 就 已 经 有 几 千 行 输出 
T). 

一 个 多 星期 后 ， 案 子 了 结 了 ， 该 缺陷 已 经 有 人 提交 过 。 研 究 这 个 缺陷 的 开发 者 给 我 
发 了 一 个 简短 的 信息 , 说 他 已 经 将 我 的 数 千 行 代码 压缩 到 关键 的 十 行 , 很 显然 这 只 是 重 
复 了 一 个 在 几 个 星期 前 就 被 报告 了 的 缺陷 。 如 果 我 再 多 花 一 些 精 力 来 缩减 我 的 报告 范 
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围 ， 我 就 可 以 发 现 这 个 缺陷 是 重复 提交 了 ， 可 以 节省 本 来 就 很 忙 的 同事 大 量 的 时 间 。 


如 果 你 不 能 找到 一 种 最 大 限度 地 减少 重 现 问题 工作 量 的 方法 也 不 要 太 诅 天。 有 的 时 候 真 的 是 
无 法 艇 到， 而 且 在 其 他 场合 即使 能 够 进行 简化 ， 在 你 能 够 简化 之 前 也 需要 对 问题 有 深入 的 了 解 。 
我 们 稍 后 会 讨论 的 , 改进 你 的 问题 重 现 不 是 一 跃 而 就 的 事 ,而 是 在 整个 诊断 过 程 中 要 牢记 在 心 的 
东西 。 


2. 最 大 限度 地 减少 所 需 的 时 间 


有 些 缺 陷 只 是 需要 时 间 来 重 现 一 一 这 不 取决 于 你 做 了 多 少 ， 而 取 诀 于 你 做 了 多 长 时 间 。 比 如 
某 个 Web 应 用 程序 在 处 理 几 千 个 请 求 后 就 会 崩溃 。 这 往往 是 某 种 类 型 的 资源 泄漏 问题 (内存 、 文 
件 句 柄 或 其 他 类 似 的 问题 )。 


如 果 你 怀疑 这 可 能 是 出 了 问题 ,你 有 可 能 采取 几 种 办 法 来 使 之 早 些 发 生 。 最 明显 的 是 , 你 可 
以 在 任何 将 用 完 的 资源 上 做 文章 , 要 么 采用 直接 的 方式 , 要 么 通过 修改 代码 在 启动 的 时 候 占用 大 
量 资 源 ， 从 而 在 正常 的 运行 时 能 很 快 耗 尽 。 此 外 ， 你 可 以 假装 营造 出 资源 耗 尽 的 局 面 ， 比 如 用 一 
个 适时 失败 的 函数 取代 分 配 资源 的 函数 ， 从 而 尽早 再 现 问题 。 


2.5.2 ”将 不 确定 的 缺陷 变 为 确定 的 


软件 之 美的 一 部 分 体现 在 它 的 确定 性 上 一 一 计算 机 精确 地 做 着 你 让 它 做 的 事 , 而 且 如 果 起 点 
相同 ， 那 么 它 每 次 都 会 精确 地 做 同样 的 事情 。 然 而 ， 每 个 开发 人 员 不 论 开发 了 多 长 时 间 的 软件 ， 
都 会 遇 到 不 确定 性 的 软件 一 一 你 每 次 做 法 一 样 ， 它 却 表现 不 一 ， 忽 左 忽 右 。 


pry 那么 ， 这 种 不 确定 性 从 何 而 来 ? 这 当然 不 会 是 随机 的 
Nondeterminism can have 宇宙 射线 引起 内 存 中 比特 值 发 生 改 变 (不 管 你 听 说 过 多 少 
saky. a Zew- coii: 老 程序 员 的 传说 ) 。 不 确定 性 只 能 有 几 个 原因 ， 


O 开始 于 不 可 预知 的 初始 状态 ， 
D 与 外 部 系统 进行 交互 

O 故意 地 使 用 随机 性 ; 

口 多 线程 。 


我 们 依次 考虑 这 些 原因 。 


2.5 改进 问题 重 现 A 23 


W 小 乔 爱问 
过 为 什么 不 确定 的 缺陷 是 一 个 问题 


设想 一 下 ,你 正在 处 理 一 个 每 陪 一 次 才能 重 现 的 缺陷 。 你 认为 自己 已 经 进行 了 修复 ,但 
是 因为 你 的 重 现 是 时 断 时 续 的 ， 因 此 就 不 能 简单 地 测试 并 判断 说 缺陷 不 会 出 现 了 ,因为 很 有 
可 能 只 是 在 这 一 次 缺陷 没有 发 生 。 每 次 测试 成 功 之 后 ， 你 都 增强 了 信心 ,但 是 你 永远 不 能 完 


全 确认 已 经 修复 了 缺陷 。 


如 果 说 判断 是 否 已 经 修复 一 个 间歇 性 的 缺陷 是 很 困难 的 ,那么 诊断 这 样 的 缺陷 就 更 加 力 
难 。 每 次 运行 一 个 实验 ， 你 部 不 能 确定 观察 到 的 运行 结果 到 底 是 失败 的 还 是 成 功 的 。 这 样 是 
很 难 取得 进展 的 ， 也 极 易 陷入 困 总 ， 形 成 错误 的 推断 ， 得 到 错误 的 结论 。 最 重要 的 是 ， 它 今 
AF iL! 





1. 开始 于 不 可 预知 的 初始 状态 


当 你 的 软件 从 未 经 初始 化 的 内 存 读 取 数据 时 ,通常 就 会 出 问题 。 现 代 的 操作 系统 总 是 在 你 可 
以 使 用 内 存 之 前 就 对 它 进行 了 初始 化 , 现代 的 编程 语言 不 可 能 使 用 没有 经 过 初始 化 的 内 存 , 这 意 
味 着 这 类 不 确定 性 问题 较 之 以 前 没 那么 严重 了 。 然 而 ，C/C++ 程 序 员 在 某 些 环境 中 运行 程序 仍 不 
得 不 担心 这 一 点 。 即 使 你 的 程序 代码 是 用 Java 编写 的 ， 你 也 可 能 发 现 与 自己 连接 的 第 三 方 系统 
有 这 个 问题 ， 因 此 ， 你 不 能 完全 忽视 这 个 问题 。 


如 果 你 有 理由 相信 , 是 这 个 原因 导致 了 不 确定 性 问题 , 那么 你 最 好 的 选择 可 能 是 使 用 调试 内 
存 分 配器 ( 见 A.3 节 ), 来 强制 内 存 被 初始 化 为 一 个 众所周知 的 值 , 或 用 内 存 完整 性 检验 软件 ( 见 
A.4 节 ) 来 检测 是 否 引 用 了 未 初始 化 的 内 存 。 


2. 与 外 部 系统 进行 交互 

与 外 部 系统 交互 引起 的 不 确定 性 问题 往往 不 是 因为 二 者 表现 不 一 , 而 是 因为 时 间 上 微妙 的 不 
同 。 因 为 它 在 你 的 软件 中 并 没有 以 锁定 模式 运行 ， 当 输入 到 来 时 ， 你 的 软件 有 时 处 于 一 种 状态 ， 
有 时 处 于 另 一 种 状态 中 。 

如 果 你 面 对 的 是 这 种 问题 ， 解 决 的 策略 就 是 能 够 精确 控制 从 外 部 系统 接收 了 什么 ,以 及 何 时 
接收 的 。 因 此 ， 你 最 好 的 选择 可 能 不 是 试图 直接 控制 外 部 系统 ， 而 是 用 你 能 控制 的 东西 替换 它 ， 
比如 调试 子 系统 或 代替 测试 (我 们 将 在 9.1 节 讨 论 代 替 测 试 )。 
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3. 故意 使 用 随机 性 


随机 性 构成 了 一 些 软件 的 内 在 元 素 ， 例 如 ， 牌 类 游戏 或 者 提供 随机 密 钥 的 安全 性 软件 。 一 些 
故意 结合 随机 性 的 软件 ， 其 运行 具有 不 确定 性 是 没有 什么 好 惊讶 的 。 


幸运 的 是 , 大 部 分 所 谓 使 用 随机 数 的 软件 并 不 是 真正 意义 的 随机 , 而 是 通过 确定 性 算法 产生 
的 伪 随 机 数 , 这 种 做 法 在 随机 性 上 做 得 很 好 。 他 们 有 个 非常 有 用 的 属性 ， 那 就 是 如 果 你 设置 一 个 
已 知 值 作为 种 子 〈 作 为 初始 化 随机 数 生 成 器 的 值 )， 那 么 你 将 会 从 随机 数 生成 器 中 得 到 同样 的 序 
列 号 (因此 ， 这 是 个 完全 可 以 预测 的 行为 )。 


4. 多 线程 


由 多 线程 引起 的 不 确定 性 尤其 难以 处 理 。 在 单 核 CPU 中 ， 一 个 线程 可 以 在 任何 时 候 中 断 另 
一 个 线程 。 在 多 核 系统 盛行 的 今天 ， 往 往 我 们 处 理 的 并 不 是 真正 的 并 发 。 


如 果 有 可 能 , 你 可 以 仍 用 原来 的 方法 重 现 问题 ， 最 简单 的 解决 方法 常常 是 运行 软件 而 不 用 任 
何 线 程 。 如 果 不 能 这 样 ， 那么 你 必须 考虑 使 软件 能 够 在 你 的 控制 下 随 环境 变换 ,而 不 是 让 它 听 调 
度 程序 随机 摆布 。 这 种 方法 简单 与 否 ， 依 赖 于 软件 的 设计 ， 以 及 你 是 否 构建 了 这 样 的 控制 。 


在 缺乏 并 发 控制 的 结构 化 方法 的 情况 下 ， 你 将 不 得 不 依靠 一 些 特殊 的 方法 。 因 此 , 在 你 的 处 
理 方法 中 最 有 效 的 工具 之 一 就 是 不 起 眼 的 sleepQ 〇 方法 , 这 个 方法 允许 你 强制 一 个 线程 长 时 间 等 
待 而 出 现 竞争 状态 (这 是 一 种 依赖 于 事件 的 序列 与 时 间 的 行为 )。 


例如 , 假设 你 正在 工作 的 软件 中 多 个 工作 线程 并 行 处 理工 作 项 目 (多 线程 软件 中 一 个 普通 的 
模式 )。 工 作 线程 使 用 下 面 的 Java 代码 来 获得 工作 项 目 ， 


ifCitem = workQueue. lockWorkItem()) { 
jtem.processQ); 
workQueue.writeResul tAndUn1ock (item) ; 
$ 
你 在 试图 跟踪 一 个 间歇 出 现 的 缺陷 : 有 时 同一 个 工作 项 目 会 同时 分 配给 两 个 工作 线程 。 遗憾 的 
是 ， 这 种 情况 极 少 出 现 。 你 可 以 把 代码 修改 如 下 来 增加 重 现 这 种 问题 的 几率 。 
if(item = workQueue.lockWorkItem()) { 
eo Thread.sleep(1000) ; 
jitem.process(); 
workQueue.writeResultAndUnlock(item) ; 


} 
在 @ 处 调用 sleepQ 〇 方法 可 以 大 大 增加 出 现 竞争 状态 的 可 能 性 ， 使 问题 更 容易 出 现 。 


注意 ,尽管 steepQ 〇 方法 在 重 现 问题 和 诊断 阶段 很 有 用 ,但 在 修复 缺陷 阶段 它 不 是 一 个 合适 
的 方法 。 我 们 将 在 8.3 节 作 更 深入 的 探讨 。 
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2.5.3 自动 化 


对 一 些 步 又 运用 必要 的 自动 化 手段 来 重 现 缺 陷 ， 不 但 可 以 加 快 进程 还 可 以 减少 犯错 误 的 几 
率 。 越 是 复杂 的 重 现 , 运用 自动 化 受益 就 越 多 , 但 是 对 于 一 些 非常 简单 的 测试 要 考虑 是 否 值得 这 
么 做 。 


1. 自动 化 测试 

可 能 最 有 效 的 方法 就 是 使 用 你 的 自动 化 测试 框架 (假设 你 拥有 一 个 )。 一 个 自 定义 测试 不 仅 
能 够 方便 地 运行 ,而 且 当 诊断 结束 开始 修复 工作 的 时 候 ， 对 于 即将 编写 完成 的 测试 来 说 ， 它 是 一 
个 很 好 的 起 点 。 

另外 ， 如 果 你 的 重 现 需要 一 长 串 用 户 接口 行为 ， 可 能 就 要 考虑 使 用 A.4 节 中 的 用 户 接口 测试 
工具 。 

2. 重 放 日 志文 件 

如 果 你 确定 缺陷 重 现 需要 通过 日 志 ， 那 么 你 可 以 有 另 一 种 选择 一 一 重 放 日 志文 件 。 在 图 2-1 
中 ， 我 们 说 明了 日 志 代理 如 何 被 用 来 记录 你 试图 调试 的 软件 与 第 三 方 服务 器 之 间 的 交互 。 在 图 
2-2 中 ， 我 们 可 以 看 到 从 日 志 读 取 的 第 三 方 服务 器 的 仿真 版 本 ， 可 以 用 来 重新 构造 任意 相同 的 操 
作 序 列 。 





仿真 服务 器 


图 2-2 在 日 志文 件 中 重 放 
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2.5.4 AR 


在 诊断 过 程 中 , 你 构建 了 越 来 越 多 的 关于 如 何以 及 为 什么 软件 如 此 运行 的 信息 。 你 可 以 而 且 
应 该 使 用 这 些 信息 来 不 断 地 改进 你 的 重 现 ， 如 图 2-3 所 示 。 





找到 一 种 重 现 
问题 方法 
用 重 现 问题 方法 
进行 学 习 









用 新 的 知识 改善 重 现 | 
| 问题 方法 


否 < 找到 问题 O2 
是 
图 2-3 ”改进 重 现 


比如 ， 最 初 你 通过 给 应 用 程序 提供 大 的 输入 文件 来 重 现 问题 。 你 一 开始 想 尝试 把 文件 变 小 ， 
BRARD, 并且 (甚至 更 差 ) 运行 三 饥 程 序 但 缺陷 仅 出 现 一 次 ， 那么 你 可 以 按照 如 下 步骤 反复 
地 改进 你 的 重 现 。 


(1) 你 确定 一 个 特定 的 模块 已 包含 在 内 ， 其 中 有 导致 缺陷 的 元 素 。 这 样 就 可 以 创建 一 个 更 小 
的 文件 。 

(2) 进一步 诊断 ， 发 现 你 能 通过 用 桩 模块 替代 与 第 三 方 服务 器 交互 的 子 系统 ， 让 问题 每 次 都 
出 现 ， 桩 模块 可 以 很 容易 返回 已 经 确定 的 响应 。 

(3) 最 后 ， 你 把 跟踪 范围 缩小 到 一 个 特定 的 函数 ， 通 过 设置 一 组 具体 的 参数 调用 该 函数 来 创 
建 单元 测试 ， 以 便 重 现 问题 。 
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调试 的 艺术 就 在 于 总 是 像 上 面 那样 寻找 机 会 使 自己 的 生活 更 简单 。 
26 ”如 果真 的 不 能 重 现 问题 该 怎么 办 

有 的 时 候 ， 无 论 你 怎么 努力 ， 也 无 法 重 现 你 所 跟踪 的 缺陷 ， 那 么 该 怎么 办 ? 
2.6.1 缺陷 真 的 存在 吗 


当然 , 一 种 可 能 性 就 是 你 在 追逐 一 个 幻想 , 而 实际 上 缺陷 并 不 存在 。 如 果 你 有 足够 的 证 据 证 
明 缺 陷 不 存在 , 这 当然 很 好 。 但 是 请 小 心 , 你 必须 确定 已 用 尽 了 所 有 可 用 的 方法 一 一 以 我 的 经 验 看 ， 
软件 开发 者 通常 过 于 草率 地 得 出 “缺陷 不 存在 ”这 个 结论 。 

如 果 你 决定 以 “需要 更 多 的 信息 ”或 者 “我 看 运行 正常 ”( 或 者 任何 相似 的 状态 ) 为 结论 ， 
那么 不 要 简 简 单单 地 就 此 终止 。 用户 一 般 不 会 恶意 地 报告 缺陷 。 对 他 们 来 说 极 有 可 能 是 软件 真 的 
运行 出 错 了 。 可 能 他 们 没有 非常 清楚 地 解释 为 什么 运行 出 错 了 ,或 者 误解 了 软件 的 一 些 方面 。 花 
- 些 时 间 来 向 他 们 描述 你 所 做 的 事情 ， 想 办 法 获取 些 额 外 信息 ， 帮 助 你 彻底 弄 清楚 他 们 遇 到 的 问 
题 。 


2.6.2 在 相同 的 区 域 解决 不 同 的 问题 
在 你 重 现 问题 的 同一 区 域 还 有 其 他 缺陷 吗 ? 如 果 有 ， 即 使 它们 (从 表面 上 看 ) 没有 你 目前 跟 
踪 的 缺陷 那么 严重 和 紧急 ， 但 也 值得 一 查 到 底 。 有 两 方面 的 原因 来 说 明 为 什么 应 该 如 此 。 


第 一 ， 这 是 清理 这 个 区 域 代码 的 好 方法 。 你 可 能 会 发 现 真正 寻找 的 问题 被 其 他 问题 掩盖 了 。 
将 这 些 问题 解决 了 ， 会 发 现 原来 要 找 的 缺陷 将 更 加 清晰 。 


第 二 , 解决 一 个 可 以 重 现 的 问题 是 从 总 体 上 更 好 地 了 解 代码 的 好 方法 。 这 种 深入 的 理解 能 帮 
你 了 解 程序 的 内 部 机 制 ， 并 找到 重 现 问题 的 关键 因素 。 


就 算 这 些 都 没有 帮助 ， 最 坏 的 情况 是 你 将 修复 一 些 并 不 紧急 的 缺陷 。 
26.3 ”让 其 他 人 参与 其 中 


开发 人 员 很 容易 有 盲点 。 我 们 必然 与 用 户 具有 不 同 的 视角 , 同时 这 也 意味 着 我 们 将 失去 一 些 
重要 的 信息 , 而 这 些 信息 从 用 户 的 视角 来 看 可 能 显而易见 。 此 外 , 我 们 的 工作 重点 是 让 编写 的 软 
件 可 以 正常 运行 ， 而 不 是 证 明 这 个 软件 有 缺陷 。 


因此 , 让 一 些 可 以 从 别 的 角度 解决 问题 的 人 参与 进来 是 非常 有 帮助 的 。 例 如 ,你 的 客户 服务 
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团队 可 能 对 你 的 用 户 非常 了 解 , 而 你 的 测试 团队 之 所 以 存在 , 就 是 为 了 找到 各 种 方法 来 证 明 软 件 
是 存在 缺陷 的 。 

如 果 你 可 以 和 第 一 时 间 反 馈 错 误 的 人 进行 交谈 那 是 最 好 的 。 我 们 将 在 6.2 节 深 入 讨论 这 点 。 


2.6.4 ”充分 利用 用 户 群体 


如 果 缺 陷 出 现在 外 部 系统 中 , 而 不 是 发 生 在 你 的 开发 系统 中 , 或 许 应 该 让 用 户 为 你 收集 所 需 
要 的 信息 。 但 这 种 方式 并 不 理想 ， 理 由 如 下 。 
你 需要 通过 一 些 方法 找到 该 软件 的 工具 版 本 给 用 户 。 
0 它 仅仅 适用 于 一 些 用户 群 体 一 一 他 们 得 准备 不 厌 其 烦 地 帮 你 解决 一 些 问题 ,而 且 还 需要 具 
备 相 当 的 技术 实力 。 
D 从 你 决定 需要 收集 什么 样 的 信息 到 从 相关 领域 获得 这 些 信息 ， 这 个 迭代 的 周期 可 能 远 远 
超过 你 的 预期 。 
但 是 如 果 所 处 的 环境 允许 你 这 样 考虑 ， 它 会 是 非常 有 效 的 。 如 果 工 作 的 平台 是 开源 软件 ， 这 
种 方法 就 特别 值得 考虑 ， 因 为 开源 用 户 群 体 可 以 更 加 开放 地 参与 到 调试 过 程 中 。 


2.6.5 ”推测 法 
虽然 使 用 实证 方法 进行 调试 通常 是 最 好 的 ,但 它 不 是 唯一 的 解决 办 法 。 如 果 你 不 能 重 现 缺 陷 ， 
那么 能 够 使 用 实证 方法 的 一 个 重要 工具 就 丢失 了 ， 这 样 你 就 必须 寻找 其 他 的 解决 方法 。 
其 中 一 种 方法 就 是 纯 逻 辑 推理 , 思考 为 什么 软件 的 一 些 功 能 要 这 么 做 。 这么 做 可 能 会 非常 费 
时 和 环 手 。 但 是 当 其 他 方法 无 效 时 ， 它 往往 可 以 起 到 作用 。 
你 现在 需要 做 的 就 是 “把 你 自己 融入 到 软件 中 ”, 在 你 的 想象 中 执行 软件 。 执 行 到 每 一 步 时 ， 
考虑 有 哪些 出 现 错误 的 可 能 性 ， 尝 试 解释 你 跟踪 的 缺陷 。 
复制 带 来 的 问题 
我 们 曾经 开发 了 一 个 基于 MySQL 数据 库 的 Web 应 用 程序 。MySQL 提供 了 一 个 非 
常 有 用 的 复制 功能 ， 我 们 用 这 个 功能 设置 两 台 服 务 器 ， 一 台 主 服务 器 ， 一 台 从 服务 器 。 
主 服务 器 承担 所 有 的 工作 ,从 服务 器 复制 所 有 发 生 在 主 服务 器 上 的 工作 。 这 意味 着 如 果 
主 服务 器 宕 机 ， 从 服务 器 可 以 作为 备用 服务 器 使 用 。 生 活 真美 好 。 
大 部 分 情况 下 是 这 样 的 。 
但 是 偶尔 几 次 ， 从 服务 器 崩溃 了 ， 只 提供 了 一 些 非 常 模糊 的 错误 信息 。 唯 一 能 使 系 
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统 复活 的 方法 就 是 重新 创建 从 服务 器 上 的 主 服务 器 数据 库 的 备份 ， 从 头 开始 配置 复制 。 
有 些 时 候 从 服务 器 在 重新 复制 几 天 后 就 骨 演 了 ,而 有 些 时 候 连 续 运 行 几 个 月 都 没有 问题 。 


很 明显 出 问题 了 ,但 是 我 们 不 知道 问题 出 在 哪里 。 我 们 排除 了 硬件 出 错 的 可 能 性 ， 
因为 我 们 可 以 互 换 主 从 服务 器 ， 这么 做 仍然 会 出 现 从 服务 器 刚才 出 现 的 问题 。 我 们 不 可 
能 在 测试 系统 中 复制 这 个 问题 一 一 它 只 可 能 出 现在 产品 服务 器 上 , 日志 也 没有 提供 给 我 
们 有 用 的 信息 ， 搞 不 清 到 底 发 生 了 什么 。 


我 们 担心 ,或许 唯一 的 解决 办 法 是 要 买 两 台 以 上 的 服务 器 用 来 重 现 问 题 , 同时 编写 
一 个 非常 复杂 的 测试 用 来 模拟 现实 的 负载 。 很 明显 ,追踪 这 种 缺陷 将 会 是 长 时 间 的 ， 涉 
及 面 很 大 ， 十 分 唱 贵 。 


然而 在 此 之 前 , 我 决定 仔细 地 回顾 一 下 我 们 之 前 编写 的 用 来 复制 的 脚本 。 我 把 脚本 
打印 出 来 , 又 打印 了 一 份 MySQL 文档 的 副本 ,还 有 所 有 我 通过 Google 能 够 找到 的 关于 
MySQL 复制 可 能 会 出 错 的 相关 信息 ， 坐 下 来 仔细 地 研究 。 通 过 几 天 对 脚本 的 分 析 ， 在 
白板 上 绘制 图 表 ， 和 小 组 其 他 成 员 讨论 可 能 出 现 的 问题 (“ 我 是 主 服 务 器 ， 你 们 是 从 服 
务 器 ，Thomas 是 客户 端 一 -这 将 会 发 生 什么 ……?“)。 最 终 我 们 探测 到 了 问题 出 在 加 
锁 时 出 现 的 一 个 竞争 条 件 ， 我 们 用 它 来 确保 得 到 一 个 不 间断 的 数据 库 快照。 


确认 问题 之 后 ， 修 复 便 很 简单 了 ， 从 此 从 服务 器 又 可 以 顺利 地 复制 了 。 


令 人 高 兴 的 是 ， 如 上 例 的 这 些 情况 是 非常 少见 的 , 正常 来 说 你 有 能 力 重 现 这 个 问题 。 在 下 一 
章 ， 我 们 将 会 看 到 如 何 使 用 重 现 来 诊断 问题 。 
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O 在 做 任何 事情 之 前 找到 问题 重 现 的 方法 。 
口 确认 你 运行 的 版 本 和 提出 缺陷 的 版 本 是 相同 的 。 
口 复制 报告 缺陷 时 使 用 的 环境 。 
口 确定 重 现 缺 陷 需 要 的 输入 数据 : 
m 推测 数据 ， 
到 通过 日 志 记录 合适 的 输入 数据 。 
O 通过 反复 优化 确保 你 重 现 问题 的 程序 既 方 便 又 可 靠 。 
m 减少 运行 步骤 、 数 据 量 或 需要 的 时 间 。 
n 去 除 不 确定 性 。 
a 自动 化 。 
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诊断 问题 是 程序 调试 的 关键 。 这 个 阶段 我 们 可 以 开始 解决 缺陷 问题 了 , 你 可 以 了 解 看 到 的 运 
行 结果 背后 的 根本 原因 。 

在 这 一 章 中 ， 我 们 将 介绍 以 下 内 容 : 

口 核心 的 诊断 过 程 ， 

O 各 类 实验 以 及 如 何 才 能 进行 一 次 好 的 实验 ， 

a 一 些 有 用 的 策略 。 


3.1 不 要 急于 动手 一 一 试 试 科学 的 方法 


尽管 你 可 以 使 用 各 种 各 样 的 工具 和 技术 ， 并 利用 软件 自身 来 帮助 你 找 出 缺陷 ， 但 是 请 记 住 ， 
你 最 重要 的 财富 是 你 的 智慧 。 这 一 点 永远 都 不 会 变 。 你 是 用 你 的 脑子 而 不 是 用 计算 机 来 进行 诊 
断 。 





当 调试 程序 时 你 需要 的 思维 方式 和 侦探 破案 、 科 学 家 
Noe ee en viper. 调查 菜 个 新 现象 的 思维 方式 是 类 似 的 (因为 问题 是 类 似 
的 )。 真 正 有 效 的 缺陷 修复 要 求 思维 方式 既 开 放 又 有 条 不 
K, 解决 方 法 既 创 新 又 注重 全 面 综合 , 这 和 软件 开发 的 其 他 很 多 方面 是 一样 的 ， 说白 了 就 是 寻找 
一 各 方法， 能 够 平衡 以 上 看 似 巴 盾 的 需求。 
科学 的 方法 应 该 在 正 反 两 个 方向 都 可 行 。* 我 们 可 以 先 提 出 一 个 假设 ， 然 后 再 通过 实验 去 证 
明 假设 正确 与 否 ， 实 验 结果 要 么 支持 假设 ， 要 么 否定 假设 而 取 其 对 立 面 。 我 们 也 可 以 先 提 出 一 个 
与 现实 理论 不 符合 的 观察 结论 ， 进 而 去 修改 现 有 的 理论 或 者 干脆 将 错误 的 理论 彻底 修正 。 


在 调试 的 过 程 中 ， 我 们 几乎 总 是 使 用 后 者 。 观 察 (出 现 缺陷 ) 证 明 我 们 的 理论 (软件 应 该 像 





@ 学 习 科学 历史 与 哲学 的 人 会 意识 到 我 略 过 了 许多 细微 之 处 。 
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我 们 想象 的 那样 运行 ) 是 错误 的 ， 正 如 托马斯 " 赫 胥 黎 所 说 :“ 科 学 的 最 大 悲剧 在 于 美丽 的 猜想 
被 丑陋 的 事实 所 扼杀 。” 


一 种 调试 方法 


当 发 现 事 情 出 乎 意料 之 后 ,你 的 任务 就 是 去 修正 你 对 软件 的 理解 , 直到 你 确实 了 解 了 它 真正 
的 运行 状况 。 为 了 做 到 这 一 点 ， 你 需要 按照 第 一 种 方法 来 做 一 一 提出 一 个 可 能 提供 解释 的 假设 ， 
然后 再 构建 实验 去 证 明 你 的 假设 。 


因此 ， 对 我 们 来 说 比较 理想 的 处 理 过 程 应 该 是 这 样 的 ( 见 图 3-1)。 
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(1) 按照 你 对 软件 运行 情况 的 理解 ， 提 出 一 个 可 以 导致 这 种 运行 状况 的 假设 。 

(2) 设计 一 个 实验 ， 证 明 你 的 假设 正确 与 否 。 

(3) 如 果 你 设计 的 实验 不 能 证 明 你 的 假设 ， 那 么 重新 设计 一 个 实验 ， 然 后 再 次 进行 实验 。 
(4) 如 果实 验 支 持 你 的 假设 ， 那 么 继续 进行 实验 ， 直 到 能 证 明 或 证 伪 你 的 假设 。 


这 种 方法 十 分 有 效 ， 但 却 十 分 抽象 。 怎 样 才能 把 它 转化 为 实际 行动 呢 ? 
1. 不 同类 型 的 实验 


实验 起 点 就 是 我 们 在 第 2 章 中 已 经 详细 阐述 过 的 问题 。 由 此 出 发 可 以 进行 几 种 不 同类 型 的 实 
验 ， 每 一 个 都 会 换个 角度 再 现 问题 。 
O 你 可 以 检查 该 软件 内 部 状态 的 某 个 方面 (或 者 直接 运行 程序 ， 或 者 利用 调试 器 运行 )。 
口 你 可 以 改变 软件 运行 的 某 个 方式 (例如 ， 改 变 输入 的 参数 ， 或 者 换 一 个 运行 环境 )， 看 它 
的 运行 结果 是 否 有 所 不 同 。 
OD 你 可 以 改变 软件 本 身 编码 的 逻辑 ， 检 查 这 种 变化 的 影响 。 
做 出 什么 选择 要 由 你 的 假设 的 性 质 而 定 ， 而 能 否 做 出 最 佳 的 选择 取决 于 你 的 经 验 和 直 


然而 无 论 你 选择 哪 一 个 ， 请 记 住 ， 最 重要 的 是 你 的 实验 必须 要 有 一 个 明确 的 目标 。 
2. 实验 必须 起 到 验证 的 作用 


实验 是 一 种 达到 目的 的 手段 ， 而 不 是 目的 本 身 。 如 果 不 能 用 实验 证 明 一 些 东西 ， 那 么 你 的 实 
验 就 是 毫 无 意义 的 。 


RRS HRM AR? 在 花费 时 间 和 精力 来 构建 和 运行 实验 之 前 ,请 首先 问 
”What is your experiment 问 自己 实验 能 揭示 出 什么 有 哪些 可 能 发 生 的 结果 ? 如 果 
going to tell you? A ; 
ne EAE UH EID, IBZ AS 
早 换 一 个 。 不 要 以 为 你 在 行动 就 是 取得 了 进展 ， 如 果 你 设计 的 实验 无 法 加 深 你 对 软件 的 理解 , 那 
么 这 种 实验 只 是 在 浪费 时 间 而 已 。 


你 可 以 设计 实验 来 证 明 或 者 推翻 你 的 假设 。 虽 然 听 起 来 似乎 有 悖 常理 ， 但 事实 上 常常 是 推 
翻 假设 的 实验 更 有 用 。 可 以 说 这 是 因为 彻底 证 明 一 件 事 是 很 难 的 (因为 你 看 到 了 你 所 期 望 看 到 的 
并 不 意味 着 它 是 按照 你 认可 的 原因 产生 的 )， 但 其 实 主要 还 是 一 个 心理 问题 。 


对 于 发 生 的 事情 , 如 果 你 已 经 有 了 一 个 似乎 合 理 的 解释 , 就 很 容易 想当然 地 认为 它们 是 正确 
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的 。 与 他 人 争辩 并 试图 推翻 你 的 假设 是 非常 有 效 的 方法 , 这 可 以 帮助 你 找到 自己 的 想法 中 未 曾 意 
识 到 的 漏洞 。 如 果 假 设 始 终 成 立 ， 尽 了 最 大 的 努力 也 无 法 推翻 它 ， 那 么 你 可 以 底气 十 足 地 宣称 
你 的 假设 坚不可摧 。 有 时 你 自己 都 会 感到 惊讶 ， 发 生 的 事情 和 你 原来 的 想法 大 相 径 庭 。 


3. 每 次 只 做 一 个 修改 
设计 实验 的 基本 规则 之 一 是 ， 你 每 次 只 能 做 一 个 修改 。 


如 果 你 仅仅 做 出 一 处 修改 就 得 到 了 结果 ， 那 么 就 基本 
改 

可 以 确定 是 这 个 修改 导致 了 结果 的 变化 "。 如 果 你 做 出 的 ee 人 
修改 不 止 一 处 ， 那 么 我 们 就 很 难 确 定 是 哪 处 修改 导致 了 哪 Multiple changes lead to 
个 结果 。 这 多 处 修改 之 间 也 可 能 会 发 生 一 些 意 想不到 的 相 ”mitsleading conclusions. 
互 作用 。 最 乐观 的 结果 是 ， 通 过 实验 你 可 能 无 法 得 到 有 用 
的 信息 。 但 最 坏 的 情况 则 是 ， 你 得 到 的 错误 结论 将 你 引 向 了 一 个 完全 错误 的 方向 。 

此 规则 适用 于 任何 修改 ， 源 代码 的 修改 、 环 境 的 变化 、 输 入 文件 的 变化 等 都 适用 。 事 实 上 ， 
它 适 用 于 任何 可 能 影响 软件 运行 的 要 素 。 

但 是 令 人 大 跌眼镜 的 是 ， 由 于 某 些 原因 ， 这 个 原则 却 经 常 被 人 忽略 。 我 已 记 不 清 有 多 少 次 看 
见 有 些 人 一 次 做 了 多 个 修改 , 然后 就 根据 实验 结果 得 出 结论 。 虽然 同时 做 几 处 修改 看 起 来 比较 节 
省 时 间 ， 但 实际 上 你 所 得 到 的 可 能 只 是 无 效 结果 。 请 牢记 这 一 点 ， 不 要 再 犯 这 种 错误 。 

最 后 ， 当 你 发 现 程 序 运行 结果 改变 时 ， 就 撤销 所 有 引起 这 种 变化 的 操作 ， 看 看 程序 是 否 恢 
复 到 原来 的 状态 。 这 一 招 很 管用 ， 能 清 清楚 楚 地 表明 你 看 到 的 就 是 原因 和 结果 ， 而 不 是 意外 的 
发 现 。 


4. 记录 你 所 做 过 的 调试 

如 果 你 连续 几 天 甚至 几 个 星期 都 在 调试 一 个 缺陷 , 那么 最 终 你 会 进行 很 多 不 同 的 实验 。 理想 
情况 下 ， 每 个 实验 都 会 消除 掉 一 些 可 能 的 原因 ， 并 且 最 终 你 也 将 会 找到 根本 原因 。 

当 对 软件 进行 长 期 的 调试 , 做 过 很 多 此 类 的 实验 时 ,你 很 有 可 能 会 忘记 自己 已 经 做 了 哪些 工 
作 。 这 意味 着 你 可 能 会 在 之 前 已 经 得 到 证 明 的 实验 上 面 浪 费时 间 , 或 者 进入 一 个 死胡同 。 最 坏 的 
情况 下 ， 它 可 能 导致 你 得 不 出 结论 ， 或 者 得 到 一 些 错误 的 结论 。 





O 但 还 不 能 完全 肯定 ， 一 个 不 断 变化 的 底层 系统 可 能 推翻 这 种 解释 ， 但 基本 上 可 以 如 此 假设 。 
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a EMOMREBERID 最 好 的 对 策 就 是 把 做 过 的 实验 和 结果 记录 下 来 。 不 必 
KHEF HORS, 花费 大 量 时 间 在 这 方面 ， 也 不 必 做 得 特别 细致 ， 只 要 能 够 

Periodically review what 确保 你 不 会 忘记 自己 曾经 做 过 什么 就 足够 了 。 定 期 回顾 所 
dy tried ond learned. 做 的 笔记 可 以 巩固 以 前 的 知识 , 也 有 助 于 找 出 最 有 可 能 解 
决 问题 的 后 续 步 又。 


许多 开发 人 员 发 现 记 日 记 是 十 分 有 帮助 的 。 他 们 可 以 记录 会 议 的 内 容 、 设 计 草 图 、 安 装 某 个 
软件 的 必要 的 步 又， 事实 上 ,任何 将 来 有 参考 价值 的 东西 都 应 该 记录 。 日 记 短 能 够 详细 地 记录 你 
所 做 的 实验 。 如 果 希 望 保留 电子 笔记 ， 你 可 以 考虑 使 用 个 人 的 维基 。 


5. 不 要 忽略 任何 细节 


有 时 候 你 可 能 遇 到 莫名 其 妙 的 现象 。 你 运行 一 个 实验 ， 预 期 的 结果 是 4 或 者 B， 而 实际 结果 
HUE C。 或 者 你 编写 了 一 组 关于 如 何 重 现 问题 的 指令 集 ， 但 是 软件 运行 的 结果 却 出 人 意料 。 


这 时 你 可 能 以 为 “这 是 不 可 避免 的 "， 所 以 对 它 不 予 理 皮 ， 着 手 开 始 采取 其 他 的 策略 。 
千 万 不 要 这 样 ! 软件 正 试 图 告诉 你 一 些 事情 , 为 了 自己 的 利益 你 应 该 去 听 听 软件 想 对 你 说 什 
么 。 

发 生 了 意外 意味 着 你 所 做 的 一 些 假设 是 不 正确 的 。 可 能 是 关于 软件 如 何 运 行 的 假设 ,可 能 是 
关于 你 正在 跟踪 的 缺陷 的 假设 ,可 能 是 你 已 经 构建 的 实验 的 假设 , 诸如 此 类 。 如 果 你 的 假设 存在 
问题 , 那么 你 能 做 的 最 有 价值 的 事情 就 是 停 下 来 , 确认 问题 所 在 , 然后 修复 问题 。 如 果 不 这 么 做 ， 
就 将 前 功 尽 弃 ， 得 出 的 所 有 结论 都 不 可 信 。 


塞 翁 失 马 ， 殉 知 非 福 ， 只 有 这 样 才能 了 解 软件 真实 运行 状况 。 弄 清楚 意 想不到 的 运行 状况 可 
以 为 你 节省 大 量 的 跟踪 缺陷 的 时 间 。 


一 从 太 ”即使 你 发 现 的 这 些 莫名 其 妙 的 现象 和 你 手头 工作 无 
BR Ro 关 ， 你 的 发 现 本 身 也 往往 是 非常 有 价值 的 。 凡 是 你 不 明白 


Anything that you don’t 的 都 是 潜在 的 缺陷 。 如 果 能 证 明 它 与 你 正在 做 的 工作 并 不 
understand is potentially a bu3 .相关 ， 你 可 以 把 它 放 在 一 边 ,但 不 要 忘记 它 。 要 把 它们 记 
下 来 (或 许可 以 生成 一 个 缺陷 文件 )， 经 常 重新 回顾 一 下 。 往 往 就 是 你 无 意 间 发 现 的 这 些 东西 后 
来 恰恰 被 证 明 是 需要 修复 的 缺陷 。 你 肯定 宁愿 自己 修复 以 这 种 方式 发 现 的 缺陷 , tA 
怒 的 客户 把 缺陷 报告 给 你 。 


3.2 相关 策略 十 35 


除了 保存 你 的 实验 记录 ， 日 记 薄 还 有 如 下 的 好 处 。 


O 写 出 假设 。 将 痢 做 过 的 假设 记录 在 纸 上 ， 可 以 帮 你 分 析出 假设 的 缺陷 ， 尤 其 当 假设 
很 复杂 的 时 候 。 


0 可 以 跟踪 详细 信息 ， 如 栈 跟踪 、 参 数值 和 变量 名 。 这 不 仅 可 以 帮助 你 再 发 现 一 些 问 
题 ， 而 且 在 解释 这 个 问题 时 ， 它 也 可 以 帮助 你 与 同事 进行 沟通 。 好 记性 不 如 烂 笔头 ， 
单纯 依靠 记忆 是 不 可 靠 的 。 l 

O 把 你 想 要 党 试 的 想法 列 成 一 个 清单 。 你 可 能 会 经 常 注意 到 其 他 一 些 想 要 调查 的 事物 ， 
或 者 你 起 到 一 个 接 下 来 需要 做 的 实验 ， 但 你 又 不 起 放弃 目前 的 实验 。 写 一 个 “任务 ” 


列表 可 以 确保 你 不 会 忘记 要 做 的 事情 。 
口 当 你 短暂 休息 时 ， 不 妨 在 上 面 随意 涂鸦 吧 。 





不 可 忽视 鬼 崇 现象 


我 查阅 了 昨天 的 服务 器 日 志文 件 , 收集 能 帮助 我 诊断 当前 某 个 问题 的 证 据 。 FARA, 
我 注意 到 一 个 客户 好 像 是 遇 到 了 连接 问题 一 他 不 断 地 退出 登录 又 重新 登录 。 


这 和 我 跟踪 的 问题 毫 无 关系 , 我 完全 可 以 置 之 不 顾 。 毕 竟 连 接 出 现 问题 是 很 正常 的 。 
但 我 还 是 感觉 不 对 劲 一 一 他 的 登录 模式 太 有 规律 了 。 我 强烈 预感 到 这 里 面 一 定 有 彼 。 


果然 , 这 位 有 问题 的 用 户 发 现 了 一 个 不 为 人 知 的 方法 ,可 以 越过 软件 实施 的 安全 机 
制 〈 这 个 软件 可 以 给 每 一 位 用 户 分 配 其 可 以 使 用 的 特定 资源 )。 通 过 退出 登录 又 立即 重 
新 登录 这 种 方法 ， 他 可 以 重 设 给 他 的 配额 。 我 们 现在 既然 发 现 了 这 个 问题 ,也 就 自然 能 
够 很 容易 地 解决 它 。 


3.2 ”相关 策略 


虽然 每 个 缺陷 都 是 不 同 的 , 但 以 往 的 经 验 已 经 多 次 证 明 某 些 技术 和 方法 在 追踪 大 量 问题 方 
面 很 有 效 。 它 们 不 一 定 能 解决 你 遇 到 的 每 一 个 问题 ， 但 每 一 个 程序 员 都 应 该 熟知 这 样 的 技术 和 
方法 。 


36 Ie 诊断 
3.2.1 tt 


诊断 的 所 有 内 容 都 是 与 信息 有 关 的 ， 准 确 估 测 系统 的 状态 、 程 序 的 执行 路 径 等 。 虽 然 可 以 通 
过 很 多 途径 推测 或 得 到 这 种 信息 , 但 是 到 目前 为 止 , 最 简单 、 最 直接 的 办 法 就 是 在 你 的 软件 中 使 
用 插 桩 技术 。 


播 桩 技术 本 身 也 是 代码 ,， 它 并 不 影响 软件 本 身 的 运行 , 但 是 它 却 能 告诉 我 们 为 什么 软件 会 这 
样 运行 。 在 前 面 的 章节 中 我 们 已 经 介绍 了 最 常用 和 最 重要 的 注释 类 型 一 一 日 志 。 或 许 最 早 的 调试 
技术 就 是 在 代码 中 加 入 临时 的 日 志文 件 来 ， 肯 定 或 否定 我 们 对 于 软件 运行 状况 的 理解 。 


ETET TO 但 是 插 桂 不 仅仅 限于 简单 的 输出 语句 ， 你 可 以 充分 利 
The full facilities of the 用 语言 环境 。 你 可 以 收集 和 整理 数据 ， 评 估 任 何 代 码 ， 测 
language are at your disposal. 试 相关 条 件 ， 总之, 没有 做 不 到 的 ， 只 有 想不到 的 。 


注意 海 森 堡 定律 


量子 物理 告诉 我 们 , 对 系统 的 观察 可 能 导致 系统 本 身 的 变化 。 计算机 软件 不 是 量子 力学 
(至 少 现在 还 不 是 )， 但 我 们 仍然 需要 保持 警惕 。 


对 软件 进行 插 桩 实际 上 会 改变 这 个 系统 。 这 可 不 是 简单 的 观察 ， 它 会 增加 影响 系统 行为 
的 因素 。 在 诊断 分 析 的 过 程 中 ,这 样 做 是 危险 的 ,因为 在 进行 实验 的 同时 引入 无 目的 性 的 改 
变 很 可 能 导致 你 得 出 错误 的 结论 。 


从 根本 上 讲 , 我 们 没有 办 法 保证 不 引入 一 些 副作用 。 你 自己 修改 源 代 码 意 味 着 内 存 中 目 
标 代码 的 布局 和 它 执行 的 时 间 将 会 受到 影响 。 邻 人 欣慰 的 是 , 多数 情况 下 这 只 是 我 们 瞎 担 心 
而 已 ， 只 要 小 心 避 免 更 多 明显 的 副作用 ， 这 个 问题 通常 都 是 可 以 忽略 的 。 


不 过 , 最 好 还 是 让 源 代码 尽 可 能 接近 其 原始 形式 。 不 要 让 失败 的 实验 及 其 可 能 带 来 的 副 
作用 随时 间 而 累积 。 保 持 其 原始 状态 也 有 助 于 确保 代码 易于 理解 (或 至 少 没有 更 难 )， 并 确 
保 你 在 最 终 着 手 修复 问题 的 时 候 不 要 引入 目的 不 明 的 改变 。 





让 我 们 来 看 -个 例子 。 假 设 你 正在 追踪 Java 代码 中 数据 结构 方面 的 错误 ， 并 依次 处 理 各 个 
节点 : 


© 通常 就 是 以 C 语言 的 同名 函数 命名 的 printfQ) 函 数 调试 。 
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while(node != null) { 
node.process(); 
node = node.getNext(); 
} 


会 有 提示 说 ， 有 节点 被 处 理 了 多 次 。( 换 名 话说 ,get Next() 不 止 一 次 返回 一 个 或 多 个 节点 。) 
但 是 ， 我 们 并 不 知道 不 止 一 次 返回 的 是 哪些 节点 。 


可 以 使 用 插 桩 技术 解决 这 个 问题 : 

© HashSet processed = new HashSet(); 
while(node != null) { 

© if(!processed.add(node)) { 


System,out.printin("The problem node is: ”+ node); 


} 


node.process(); 
node = node.getNext(); 
} 


在 标识 @ 处 我 们 创建 了 HashSet， 可 用 它 来 存储 已 经 处 理 过 的 节点 。 在 标识 @ 处 ， 当 前 节点 
被 添加 进 集合 中 。 如 果 该 节点 已 经 在 集合 中 了 ，addQ 〇 函数 会 返回 false， 表 明 此 节点 已 得 到 处 
理 。 


通常 情况 下 ,我 们 都 会 像 这 样 迫不及待 地 使 用 插 桩 技术 ， 并 在 取得 预期 效果 后 立即 停 用 。 但 
实际 上 插 桩 不 应 该 是 这 种 临时 抱 来 的 佛 脚 , 完全 有 理由 把 它 留 在 代码 中 , 从 而 编写 出 自 调试 软件 。 
在 10.1 节 我 们 再 介绍 相关 方法 。 


3.2.2 分 而 治之 


分 而 治之 , 或 者 叫 二 分 法 ,可 谓 是 缺陷 调试 的 一 把 瑞士 军刀 ,在 各 种 不 同 的 情况 下 它 会 一 次 
又 一 次 地 出 现 ， 帮 你 解决 难 哨 的 骨头 。 

二 分 法 是 一 种 搜索 策略 ,比如 说 你 有 一 个 包含 一 百 万 个 整数 的 分 类 数组 , 你 试图 确认 某 一 个 
数 是 否 在 这 一 数组 中 。 你 可 以 不 动脑 筋 地 依次 检查 每 个 数 , 但 平均 下 来 你 大 概 需 要 检查 五 十 万 次 
才 可 找到 你 想 要 找 的 那个 数 。 在 最 坏 的 情况 下 ， 你 可 能 需要 检查 一 百 万 次 。 


或 者 ， 你 可 以 找到 该 数组 的 中 间 点 (把 数组 划分 成 两 半 ， 每 部 分 有 50 万 个 数字 )。 如 果 该 数 
字 大 于 前 半 段 的 最 后 一 个 数 ， 你 只 需要 在 下 半 段 寻找 即 可 。 如 果 不 是 ， 那 么 你 只 需要 在 前 半 段 数 
组 中 查找 。 选 择 你 要 找 的 那 半 段 ， 然 后 依 此 方法 再 分 (现在 是 每 段 25 万 个 数 ) 。 如 此 继续 ， 那 么 
在 20 步 后 你 肯定 会 找到 你 要 的 结果 (通常 , 二 分 法 需要 的 步 又 不 多 于 log2N,，X 为 搜索 的 条 目 数 ) 。 
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该 过 程 的 最 后 几 步 见 图 3-2。 





图 3-2 二 分 法 


BATE 2.5 节 已 经 讲 过 一 个 例子 ， 用 二 分 法 帮助 我 们 有 效 地 调试 了 程序 ， 当 然 还 有 许多 其 他 
情况 。 


你 可 能 在 跟踪 内 存 损坏 的 情况 ， 你 有 办 法 检测 到 这 一 情况 (可 能 在 损坏 之 后 ， 应 该 为 零 的 变 
量 已 不 复 为 零 ), 但 是 你 无 法 知道 在 数 千 行 的 代码 中 到 底 是 哪 几 行 代码 导致 了 这 种 状况 。 将 检查 
点 播 入 到 程序 代码 的 中 间 处 ,然后 执行 。 如 果 这 时 候 同 样 的 破坏 情况 还 是 发 生 了 ， 那 么 你 可 以 判 
E, 是 代码 的 前 半 部 分 发 生 了 错误 ， 反之 ,一定 是 代码 的 后 半 部 分 发 生 了 错误 。 如 此 重复 进行 下 
去 ， 你 很 快 便 会 发 现 错误 的 代码 行 所 在 的 位 置 。 


有 的 时 候 这 种 方法 并 不 是 一 劳 永 逸 的 ， 但 用 这 种 方法 至 少 可 以 帮助 你 排除 很 多 错误 的 情况 ， 
提高 效率 。 如 果 你 的 程序 有 若干 个 相互 独立 的 模 鼠 ， 那么 尝试 禁用 所 有 这 些 模 块 ， 看 同样 的 错误 
是 不 是 又 发 生 了 。 如 果 又 发 生 了 , 那么 你 就 可 以 排除 掉 这 些 禁 用 的 模块 , 不 用 再 对 其 进行 测试 了 。 
如 果 没 有 发 生 ， 那 么 你 可 以 继续 使 用 二 分 法 排除 。 最 终 你 要 做 的 只 是 对 某 一 个 模块 进行 查 错 ， 这 
对 减少 工作 量 来 说 无 疑 有 相当 大 的 帮助 。 


但 是 不 要 太 依 赖 于 这 种 方法 ， 只 有 当 你 的 搜索 空间 可 以 被 分 成 均等 的 两 段 时 ， 这 种 方法 才 是 
最 有 效 的 。 我 们 要 的 是 减少 工作 量 、 提 高 效率 的 方法 ， 这 种 方法 并 非 只 有 二 分 法 一 个 。 


在 下 一 节 , 我 们 将 讨论 如 何 用 源 代码 控制 系统 找到 回归 错误 。 你 猜 是 什么 方法 ? 就 是 二 分 法 
的 另 一 个 应 用 实例 。 


3.23 ”利用 源 代码 控制 工具 
有 时 你 会 发 现 陷 人 了 一 种 回归 状态 : 一 个 缺陷 本 来 不 影响 正常 运行 , 但 做 了 改变 后 却 变 成 了 
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实 实在 在 的 缺陷 了 。 对 于 此 类 缺陷 ,同样 可 以 使 用 常用 的 诊断 方法 ,但 是 在 回归 跟踪 时 有 一 个 特 
别 有 价 值 的 工具 一 一 源 代 码 控制 系统 。 


如 果 你 能 准确 地 识别 是 哪个 变化 导致 了 这 些 问 题 , 那么 诊断 其 发 生 的 原因 就 轻而易举 , 你 的 
源 代 码 管理 系统 记录 了 对 程序 进行 的 所 有 修改 ， 你 所 要 做 的 就 是 从 中 揪 出 导致 该 问题 的 罪魁 祸 
首 。 


第 一 步 ， 你 要 重新 检查 所 有 的 签 人 注释 一 一 可 能 罪魁 祸首 已 经 很 明显 了 。 但 是 ， 如 果 不 是 ， 
那么 你 可 以 使 用 以 下 的 步骤 来 准确 地 定位 所 做 的 修改 。 


假如 你 已 知 错误 不 是 在 版 本 2.3 中 ,而 是 在 当前 的 版 本 3.0 中 ,而 从 2.3 到 版 本 3.0 进行 了 200 
多 次 签 人 。 现在 就 可 以 按 常 规 处 理 了 。 签 出 并 创建 一 个 中 间 版 本 ,看 看 缺陷 是 否 还 存在 ， 如 果 没 
有 ， 那 么 一 定 是 此 后 更 新 的 版 本 中 出 现 了 问题 ， 如 果 有 ， 则 说 明 问题 是 在 较 早 的 版 本 中 引入 的 。 
如 此 反复 多 次 之 后 ， 你 最 终 就 会 找到 导致 该 问题 的 原因 。” 


有 时 你 怀疑 某 处 更 改 有 问题 ,但 却 想 不 出 为 什么 会 出 问题 。 可 关键 不 在 于 找到 了 导致 问题 的 
更 改 ， 而 在 于 通过 调查 排除 了 更 多 代码 的 嫌疑 。 
3.2.4 ”聚焦 差异 


你 的 软件 正常 情况 下 都 是 能 运行 的 。 经常 是 不 管 是 谁 来 操作 , 要 诊断 的 缺陷 可 能 都 不 会 对 正 
常 运行 有 影响 。 所 以 ,你 要 寻找 的 是 一 些 特例 或 特殊 用 户 。 你 已 经 知道 它 只 影响 这 种 情况 ， 你 需 
要 做 的 就 是 找 出 它 是 什么 。 


通常 ， 当 你 尝试 重 现 问题 的 时 候 这 些 差异 就 会 显露 出 来 。 问题 是 否 只 发 生 在 一 个 特定 的 环境 
T? 那样 的 话 , 问题 最 可 能 存在 于 针对 该 环境 的 代码 中 。 问 题 是 否 只 发 生 在 使 用 大 量 输入 文件 的 
时 候 ? 那样 的 话 ， 最 有 可 能 出 的 问题 就 是 资源 泄漏 或 超 限 问题 。 


如 果 在 重 现 问题 阶段 这 些 差异 没有 显露 出 来 ， 那 么 “找到 缺陷 的 边界 ”可 能 非常 有 用 。 如 果 
你 能 找到 几 个 类 似 的 软件 运行 的 方式 ， 其 中 有 一 些 重 现 了 问题 ， 但 有 些 没有 ， 那 你 就 要 当心 了 。 
3.2.5 向 他 人 学 习 


许多 缺陷 只 在 你 的 代码 中 发 生 , 因此 只 有 你 及 合作 者 才能 解决 它们 。 但 有 时 缺陷 将 涉及 广泛 
使 用 的 技术 〈 例 如 你 的 编译 器 、 库 文件 或 你 使 用 的 框架 )， 在 这 种 情况 下 ， 很 有 可 能 其 他 人 在 你 








D 这 种 方法 非常 有 用 ，Git 源 代码 控制 系统 都 以 git bisece 命令 的 形式 为 它 提 供 直 接 的 支持 。 更 多 细节 请 参见 
Pragmatic Version Control UsingGit [Swi08]。 
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之 前 就 已 经 遇 到 同样 的 问题 了 。 


在 这 种 情况 下 ， 先 在 网 络 上 搜索 一 下 可 以 事半功倍 。 也 许 有 人 在 论坛 上 问 过 同一 类 错误 模 
块 的 问题 ， 或 写 了 一 篇 博客 痛 陈 自己 犯 下 的 错误 ， 而 这 正好 也 是 你 想 搞 懂 的 问题 。 


3.2.6 奥 卡 姆 的 剃刀 
人 们 常 说 “ 奥 卡 姆 的 剃刀 ”， 其 意思 就 是 :“ 其 他 条 件 


其 他 条 件 相 同 队 情况 下 ， 
EARE EONERAAT: O 相同 的 情况 下 ,最 简单 的 解释 是 最 好 的 
hee es ree ee 这 只 不 过 是 一 个 经 验 法 则 一 一 符合 事实 的 多 种 解释 


the simplest explanation is the 


ve 可 能 都 是 对 的 ， 不 管 它 多 么 令 人 难以 理解 、 多 么 错综复杂 


甚至 不 合 情 理 。 但 是 你 必须 先 选择 一 个 来 探究 其 真实 性 ， 





通常 最 简单 的 解释 是 最 好 的 。 
3.3 ”调试 器 


调试 器 既 有 简单 的 命令 行 调试 器 , 也 有 完全 集成 在 IDE 中 的 调试 器 , 其 复杂 程度 和 处 理 能 力 
千差万别 。 它 们 的 共同 之 处 就 是 可 以 在 代码 运行 的 时 候 对 代码 进行 检验 、 设 置 断 点 、 单 步调 试 、 
检查 程序 运行 状态 。 


这 好 像 有 点 奇怪 ， 为 何 我 现在 才 讨 论 它 呢 ? 对 于 一 些 开 发 人 员 来 说 ， 调 试 离 不 开 调试 器 ， 它 
是 他 们 使 用 的 最 重要 的 ， 还 可 能 是 唯一 的 工具 。 

毫 无 疑问 ,调试 器 是 工具 箱 中 最 强大 的 一 个 工具 ， 你 当然 应 该 花 时 间 去 熟悉 它 ， 了 解 能 做 什 
么 , 擅长 做 什么 。 但 这 里 要 说 明 的 是 : 随 着 时 间 的 推移 , 我 发 现 自己 使 用 调试 器 的 时 间 越 来 越 少 。 
而 且 这 不 是 我 个 人 的 感觉 ， 许 多 其 他 开发 人 员 在 交谈 中 告诉 我 ， 他 们 也 与 我 的 感受 相同 。 那 么 ， 
这 是 什么 原因 呢 ? 

带 来 这 种 变化 的 就 是 测试 优先 的 开发 思想 ( 见 9.1 节 )。 以 前 我 遇 到 问题 时 的 第 一 个 想法 就 
是 使 用 调试 器 ， 但 是 现在 我 首先 做 的 就 是 编写 一 个 测试 程序 。 要 理解 我 为 什么 这 样 做， 就 要 思 
考 一 下 为 什么 要 使 用 调试 器 。 在 软件 开发 生命 周期 的 如 下 三 个 不 同 阶段 ， 调 试 器 都 特别 有 用 。 


(1) 在 开发 过 程 的 初期 ， 调 试 器 是 非常 有 帮助 的 ， 对 代码 进行 单 步调 试 有 助 于 使 我 们 确信 软 
件 运行 的 结果 和 我 们 想 要 实现 的 是 一 致 的 。 

(2) 如 果 我 们 想 让 代码 以 一 种 特定 的 方式 运行 ， 就 可 以 使 用 调试 器 来 确认 或 反驳 这 个 想法 。 

(3) 最 后 ， 调 试 器 可 以 帮助 我 们 探究 看 不 懂 的 代码 。 
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但 是 有 了 测试 优先 开发 这 个 流程 ， 形 势 就 大 不 同 了 。 一 一 一 一 一 一 一 一 一 一 一 一 一 

现在 , 不 必 逐 步 跟踪 代码 来 检验 程序 是 否 按照 我 们 预想 的 PE tas 
那样 运行 , 而 是 写 一 个 或 多 个 测试 程序 来 证 明 它 确实 按照 Debugging. sessions are ephe- 
我 们 预想 的 那样 运行 了 。 如 果 对 于 缺陷 原因 有 设想 , 我 们 _meralstests are permanent. 
就 可 以 创建 一 个 测试 程序 来 证 明 这 一 点 。 这 样 做 的 好 处 在 于 测试 结果 可 以 永久 保存 。 这 就 与 在 调 
试 器 里 逐步 跟踪 代码 不 同 ,调试 器 的 结果 是 短暂 的 。 测试 不 仅 现在 证 明了 代码 是 工作 的 ,而且 今 
后 仍然 能 证 明 ， 还 能 被 其 他 的 团队 成 员 运 行 (甚至 是 改善 )。 我 们 不 仅 用 测试 证 明了 理论 的 正确 ， 
而 且 随 后 还 可 以 用 它 来 证 明 我 们 的 修复 程序 解决 了 问题 。 





交互 式 控制 台 


如 果 你 使 用 的 是 解释 性 语言 ， 比 如 Python 或 Ruby， 那 么 你 可 以 使 用 另 一 种 有 效 的 工 
具 一 一 交互 式 控制 台 。 这 可 以 让 你 直接 输入 语 向 并 让 它们 立即 执行 ， 甚 至 如 果 你 愿意 的 话 ， 
可 以 重新 定义 功能 。 控制 台 是 一 个 非常 有 用 的 研究 工具 ， 无论 是 在 调试 时 ,还 是 在 党 试 新 的 


东西 观察 其 如 何 工作 的 时 候 。 


如 果 你 使 用 的 是 编译 语言 ， 也 还 是 可 以 使 用 交互 式 控制 台 的 。 一 些 供 编译 语言 使 用 的 更 
复杂 的 调试 器 可 以 提供 一 些 非常 接近 于 交互 式 控制 台 的 工具 。 这 不 是 完全 一 样 的 东西 , 但 非 
常 相似 。 





所 以 ,可 以 把 调试 器 作为 一 个 探索 工具 。 可 以 肯定 的 是 ， 调试 器 非常 重要 , 但 是 它 起 到 的 作 
用 比 前 些 年 小 了 很 多 。 


顺便 说 一 下 ， 如 果 你 使 用 一 个 非常 新 的 开发 环境 ， 比 如 Ruby， 用 调试 器 就 十 分 方便 。 说 得 
委婉 一 点 儿 ， 目前 的 Ruby 调试 器 很 “原始 ”， 但 是 相对 于 几 年 前 来 说 问题 少 了 很 多 ， 因 为 现在 调 
试 器 用 得 少 了 。 


3.4 陷阱 


在 诊断 期 间 有 无 数 的 方法 会 误导 人 ,但 是 反复 出 现 的 方法 并 不 算 多 。 在 本 节 中 , 我 们 将 看 看 
从 实战 中 获得 的 一 些 来 之 不 易 的 经 验 教训 。 


3.4.1 你 做 的 修改 是 正确 的 吗 
如 果 你 做 的 修改 似乎 没有 任何 效果 , 那么 你 并 没有 改 到 点 子 上 。 也 许 你 编辑 的 是 某 源 代码 树 
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上 的 文件 但 是 编译 的 却 是 不 同 的 文件 ， 或 者 你 编译 了 正确 
和 果 他 做 的 迟 改 但 客 设 

fee A wart < pret AA 。 的 文件 ， 但 却 运行 了 错误 的 可 执行 文件 ， 或 者 你 编写 的 代 

点 了 上 。 码 被 预 处 理 器 禁用 了 ,或 者 你 的 浏览 器 本 应 访问 开发 服务 


If the changes #ou re making 器 却 访问 了 产品 服务 器 …… 诸 如 此 类 。 


have no ef fect, you're not chang- 
ing what you think you are. 这 些 陷阱 太 常见 了 ， 很 容易 就 会 掉 进 去 ， 又 让 人 摸 不 


着 头脑 〈 直 到 你 突 发 灵感 的 时 候 ， 你 才 突 然 意识 到 自己 的 
错误 ) ， 使 你 备 受 折磨 。 唯 一 的 防御 措施 就 是 在 潜意识 里 要 时 刻 提高 警惕 。 


承认 自己 已 经 掉 入 陷阱 的 最 简单 方法 就 是 , 在 代码 中 特意 引入 很 明显 的 失败 。 如 果 你 在 使 用 
CH, 或 许 就 是 一 个 明显 的 语法 错误 或 #error 指令 ? 或 者 调用 了 System.exit()? 当 编译 过 程 不 
能 正常 停止 或 应 用 程序 运行 得 十 分 勉强 时 ， 就 应 主动 查找 你 的 (现在 是 显而易见 的 ) 错误 。 


3.4.2 ”验证 假设 


你 所 做 的 一 切 都 是 基于 假设 的 。 你 不 可 能 不 做 假设 ,不 做 假设 是 疯狂 的 尝试 ， 因 为 你 不 可 能 
每 一 次 都 从 最 基本 的 原理 开始 工作 。 
但 假设 是 危险 的 ， 因 为 它们 会 带 来 言 点 ， 即 没有 必需 的 直接 证 据 时 就 断定 这 些 假 设 是 正确 
的 。 
有 些 假设 的 危险 性 不 大 。 例 如, 假设 你 的 编译 器 忠实 地 将 源 代码 翻译 成 正确 的 目标 代码 应 该 
是 安全 的 ， 而 假设 上 周一 个 同事 写 的 一 个 方法 仍然 一 样 有 效 ， 则 不 那么 安全 。 
THe RAM SH eK 关键 是 要 了 解 你 正在 做 什么 样 的 假设 , 以 及 何 时 对 它 
设 ， 对 它们 先行 严格 的 检验 。 们 进行 严格 的 检验 。 进 行 这 个 工作 的 一 个 特别 好 的 时 机 就 


Know what assumptions you're 是 当 你 止步 不 前 的 时 候 一 这 可 能 是 因为 其 中 的 一 个 假 


making, and examine them criti- ~ ee aes 
ais: os BERET SSCA TROL 





连续 性 是 如 何 连续 的 


早 在 20 世纪 90 年 代 初 ， 我 开发 过 一 个 性 能 要 求 高 的 、 跨 平台 的 应 用 程序 。 它 已 经 
成 功 地 运行 在 几 个 不 同 的 共享 内 存 的 多 处 理 器 架构 上 了 ,所 以 再 要 求 我 将 其 移植 到 当时 
的 最 新 的 DEC Alpha 处 理 器 上 时 ， 大 家 都 认为 那 是 很 简单 的 事 。 要 是 这 样 就 好 了 。 


我 花费 了 数 周 时 间 查 询 上 千 行 的 日 志文 件 , 但 仍然 不 能 对 我 所 看 到 的 行为 拿 出 任何 
解释 。 好 像 是 一 个 CPU 以 不 同 的 顺序 读 取 了 另 一 个 CPU 发 出 的 数据 。 但 是 ， 这 不 可 能 
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是 真 的 ， 是 吧 ? 


像 几 乎 所 有 这 个 类 型 的 其 他 机 器 一 样 ，Alpha 处 理 器 实施 连续 缓存 ， 保 证 每 个 CPU 
拥有 一 致 的 共享 内 存 视 图 。 而 且 我 们 已 经 假定 “连续 ”意味 着 被 一 个 CPU 写 入 到 内 存 
中 的 数据 将 会 被 另 一 个 CPU 以 它们 最 初生 成 的 顺序 看 到 。 


在 绝望 中 ， 我 创建 了 一 个 非常 小 的 〈 不 到 20 行 ) 测试 程序 ， 产 生 一 对 双 线 程 ， 如 
果 见 到 以 不 同 顺序 号 入 内 存 的 东西 ， 就 会 产生 激烈 反应 。 在 几 秒 钟 内 它 就 产生 了 反应 。 
这 里 的 连续 性 并 不 是 我 们 想象 的 那样 一 一 我 们 需要 使 用 内 存 屏障 ,以 保证 非常 重要 的 顺 
序 正 确 性 。” 


3.4.3 多 重 原 因 


诊断 阶段 最 常见 的 工作 ,就 是 你 要 寻找 问题 产生 的 原因 ,通常 这 是 应 该 做 的 事情 。 正 如 奥 卡 
姆 剃刀 告诉 我 们 的 ,简单 的 解释 往往 是 最 富有 成 果 的 , 假设 是 某 个 原因 产生 了 问题 要 比 假设 是 多 
个 原因 产生 了 问题 简单 得 多 。 


Ait, 正如 我 们 已 经 看 到 的 ， 奥 卡 姆 剃刀 只 是 一 个 原 
aoa 育 时 ,事情 确实 很 和 条 。 
则 ， 有 时 事情 确实 是 很 复杂 的 。 ed A 
面临 多 种 原因 的 最 常见 信号 是 一 种 你 处 于 模糊 状态 _are complicated. 
的 感觉 一 发生 了 一 些 似乎 没有 明显 解释 的 奇怪 的 事情 。 


最 富有 成 效 的 解决 多 原因 缺陷 的 办 法 是 对 问题 进行 隔离 ， 并 找到 一 个 方法 来 重 现 缺 陷 , 重 现 
的 缺陷 产生 的 原因 只 依赖 于 多 个 原因 中 的 一 个 , 而 不 依赖 于 其 他 原因 。 这 样 做 的 难 易 程度 取决 于 
你 对 问题 做 了 多 少 诊断 。 如 果 你 已 经 有 把 握 问题 会 存在 于 哪个 地 方 , 那 就 可 以 帮助 你 构建 一 个 替 
代 性 的 缺陷 重 现 方法 ， 来 回避 另 一 个 缺陷 原因 。 

另 一 种 方法 是 开始 先 找寻 同一 区 域内 其 他 较 明显 的 缺陷 。 处 理 这 些 缺 陷 有 时 可 以 扫 清 障碍 ， 
让 你 理解 得 更 透彻 ， 使 初始 问题 更 加 凸显 。 

如 果 这 些 方法 都 没有 起 到 作用 ,那么 深 吸 一 口气 一 一 这 回 你 算 遇 到 了 对 手 。 你 将 不 得 不 像 以 
前 那样 继续 你 的 诊断 ， 同 时 还 要 记 住 你 的 实验 可 能 无 法 预测 ， 因 为 它们 可 能 会 被 不 止 一 个 潜在 的 
问题 所 影响 。 这 时 没有 一 个 人 会 说 调试 很 容易 。 





© 现 如 今 ， 我 们 都 已 习惯 于 使 用 能 重 排序 以 提高 性 能 的 、 高 优化 CPU， 但 在 当时 ， 这 还 是 一 个 新 兴 事 物 。 
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3.4.4 流沙 


“模糊 ”感觉 产生 的 另 一 个 原因 是 一 个 不 断 变 化 的 基础 系统 。 我 们 依赖 的 实证 方法 的 基础 是 
我 们 可 以 一 次 又 一 次 地 重 现 问 题 ， 并 且 每 次 获得 相同 的 结果 。 没 有 了 这 种 确定 性 ， 想 取得 进展 是 
极为 困难 的 。 

这 时 ， 你 一 直 记录 在 案 的 已 尝试 的 手段 和 获得 的 结果 (你 一 直 在 记录 吗 ) 一 下 子 就 可 以 派 上 
用 场 了 。 如 果 你 重新 运行 了 一 个 实验 ， 而 今天 得 到 的 结果 与 昨天 的 不 同 ， 这 就 是 个 很 好 的 迹象 ， 
表明 在 这 段 时 间 内 肯定 发 生 了 什么 变化 。 





SH-ARGRULOR 如 果 你 怀疑 自己 遇 到 了 这 个 问题 , 请 立即 停 下 来 ， 继 
RARER, Tikaka ” 续 进 行 只 会 陷入 更 大 的 麻烦 。 你 的 主要 目标 就 是 准确 地 查 
问 星 什么 在 变化 ,为 什么 便 化 。 ” 明 究 况 是 什么 在 变化 ， 以 便 你 能 控制 它 。 


- kirata $ eds 最 明显 的 就 是 那些 与 软件 交互 的 诸如 数据 库 或 第 三 
> we re a es 
pam PETRAEA 方 系统 的 东西 ， 但 请 记 住 ， 你 的 软件 的 运行 可 能 被 太 多 不 
what’s changing and why. 

一 -一 一 一 一 一 一 一 一 同 的 因素 影响 。 也 许 你 现在 没有 足够 可 用 的 磁盘 空间 ， 没 
有 是 够 的 空间 来 容纳 一 个 临时 文件 ? 或 者 你 安装 了 一 个 新 的 软件 程序 包 , 它 更 新 了 一 个 系统 库 广 
件 ? 或 者 , 如 果 你 的 软件 每 天 根据 钟点 安排 运行 情况 , 它 甚至 可 能 只 是 因为 时 间 改 变 了 而 反应 不 
fal? 


有 12 个 月 意味 着 什么 


我 还 记得 我 的 第 一 次 团队 合作 经 历 ， 那 是 在 读本 科 期 间 ,， 我们 必须 完成 小 组 编程 任 
务 。 这 件 事 对 我 的 教育 意义 不 止 一 条 。 


我 的 团队 中 有 一 名 成 员 ， 坦 率 地 说 ， 没 发 挥 任何 作用 。 我 们 把 他 编写 的 所 有 代码 
都 丢弃 了 (不 是 说 他 写 多 了 ) ， 只 留 下 了 一 样 一 一 一 个 返回 每 月 多 少 天 的 函数 。 


总 之 ， 代 码 运行 得 很 好 ， 我 们 及 时 地 提交 了 代码 并 通过 了 所 有 的 测试 。 然 后 ， 我 们 
的 教授 联系 了 我 们 , 说 他 每 次 执行 的 时 候 都 会 崩溃 。 我 们 非常 迅速 地 跟踪 到 那个 我 们 没 
有 改写 的 函数 ， 是 它 导 致 了 问题 ， 如 下 所 示 : 


int days_in_monthCint month) { 
switch(month) { 
case APRIL: return 30; 


case MAY: return 31; 
} 
} 
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我 们 5 月 提交 的 代码 ， 但 是 我 们 的 教授 直到 6 月 才 开 始 对 代码 进行 评价 。 所 以 ， 程 
序 就 崩溃 了 。 


3.5 ”思维 游戏 

调试 是 很 艰苦 的 ， 有 时 简直 苦 不 堪 言 。 在 职业 生涯 中 ,你 保证 会 遇 到 根本 就 看 不 到 前 进 方向 
的 情况 ， 至 少 有 一 段 时 间 会 这 样 。 

有 时 看 上 去 好 像 软 件 的 运行 状况 是 根本 不 可 能 的 , 每 一 个 证 据 和 你 看 到 的 都 互相 冲突 。 如 果 
不 是 亲眼 所 见 ， 你 可 能 会 发 誓 说 这 是 不 可 能 的 。 

在 另 一 些 情 况 下 ， 你 所 调查 研究 的 各 种 方法 都 变 得 毫 无 价值 ， 而 你 又 想不到 别 的 方法 。 


不 要 灰心 。 请 放心 ,我 们 都 遇 到 过 这 种 情况 一 一 而 且 还 会 反复 遇 上 。 这 只 是 软件 开发 工作 的 
一 部 分 。 最 终 你 会 找到 一 种 解决 方法 的 。 


如 果 你 遇 到 障碍 了 ， 下 面 这 些 技巧 可 以 帮助 你 解决 这 些 问题 。 
3.5.1 ”旁观 调试 法 


最 有 效 的 一 个 扫除 障碍 的 策略 就 是 向 其 他 人 求助 。 让 一 个 已 经 几 小 时 (或 几 天 、 几 周 ) 没有 
接触 过 这 个 问题 的 人 去 审视 这 个 问题 ， 可 能 会 带 来 新 的 思路 。 即 使 他 们 不 能 立即 发 现 问题 ， 但 是 
人 多 力量 大 ， 问 题 很 有 可 能 就 会 得 到 解决 。 


这 是 怎么 回 事 
杰 瑞 米 。 塞 迪克 

我 两 岁 的 儿子 艾 丹 有 一 次 发 现 了 一 个 缺陷 。 他 指 着 屏幕 上 我 已 经 找 了 一 二 十 分 钟 
的 Lisp 代码 说 ， 他 发 现 屏幕 上 有 的 缩 进 模式 和 其 他 的 地 方 不 一 样 。 


但 是 ,任何 做 过 这 项 工作 的 人 都 知道 ， 往 往 把 问题 再 解释 一 遍 的 简单 行为 也 能 激发 灵感 。 有 
时 帮助 你 的 人 甚至 不 用 说 一 个 字 ， 他 们 就 像 张 硬 纸板 呆 在 那里 听 你 讲 就 够 了 《或 者 说 像 橡皮 鸭 、 
木头 人 ， 或 任何 其 他 无 生命 的 对 象 ) 。 
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W 小 乔 爱问 
总 如何 做 到 旁观 者 清 


虽说 旁观 者 清 , 但 实际 上 如 果 帮 助 你 的 不 是 活生生 的 人 , MAAN MSH HAHA 
非常 有 限 。 有 些 人 可 能 能 够 让 他 们 的 猫 真 的 听 懂 他 们 所 说 的 话 , 但 是 我 们 大 部 分 人 都 对 此 桂 
怀疑 态度 。 


因此 ， 要 做 到 旁观 者 清 ， 需 要 做 到 以 下 几 点 。 


口 注意 。 如 果 你 用 心 倾听 ， 你 所 “帮助 ”的 人 会 很 清楚 。 | 

口 提问 。 解 释 不 清 之 处 是 一 个 信号 ， 表 明 其 中 很 可 能 含有 一 些 未 经 仔细 考虑 的 假设 。 

口 留意 没有 探究 过 的 地 方 。 不 要 以 为 对 你 来 说 很 明显 的 事物 对 你 在 帮助 的 人 来 说 也 是 
明显 的 。 他 们 寻求 你 的 帮助 是 因为 他 们 遇 到 困难 了 ， 而 且 通 常 我 们 会 在 一 些 看 似 显 
然 的 地 方 感到 迷惑。 

口 尽力 了 解 接 下 来 将 会 发 生 人 什么。 如果 了 解 了 ， 你 可 能 会 提出 更 好 的 问题 。 而 是 这 种 
灵感 可 能 启发 了 你 解决 问题 的 思路 ， 而 对 方 是 当局 者 过 。 


W 小 乔 爱 问 
SC 如 果 我 找 不 到 可 以 交谈 的 人 怎么 办 


如 果 你 找 不 到 任何 一 个 人 来 扮演 旁观 者 ,也 不 是 就 一 筹 英 展 了 。 试 着 在 纸 上 描 述 一 下 你 
的 问题 或 者 给 朋友 写 一 封 电子 邮件 。 不 需要 审查 自己 一 一 就 像 一 个 作家 写作 那样 。 








委 这 么 做 的 理由 很 充分 。 向 其 他 人 解释 问题 会 强迫 你 

sch shannon 去 理 清 你 的 思路 ， 列 出 你 的 假设 ， 并 构建 一 个 从 基本 原则 

get pow th ht tn order, 出 发 的 观点 。 很 多 时 候 , 只 有 设身处地 才能 找到 解决 方法 。 
如 果 找 不 到 ， 你 也 不 会 失去 什么 啊 |! 





3.5.2 角色 扮演 


角色 扮演 在 解释 和 探讨 问题 时 十 分 有 用 , 特别 在 涉及 那些 互相 独立 的 系统 之 间 相 互 作用 的 问 
题 时 。“ 你 扮演 客户 端 1， 我 扮演 客户 端 2， 弗 雷 德 可 以 扮演 服务 器 。 现 在 我 们 如 何 建立 客户 端 间 
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会 话 ? ” 
MRAM, 不 要 忘记 使 用 一 些 工 具 。 索引 卡 可 以 代表 网 络 上 信息 的 交换 ,或 者 几 持 有 充 


气 “ 企 克 ” 娃 娃 的 人 都 拥有 数据 库 锁 。 我 待 过 的 大 多 数 开发 人 员 的 房间 都 堆 满 了 很 多 年 来 从 不 同 
的 展会 上 收集 的 零碎 物件 ， 让 它们 替 你 改头换面 。 


3.5.3 换 换 脑筋 


你 花费 了 令 人 诅 形 的 一 天 , 却 在 一 个 棘手 的 问题 上 没有 取得 任何 进展 。 你 非常 郁闷 地 度 过 了 
一 天 。 那 天 晚上 ， 当 你 正在 做 一 些 与 问题 完全 无 关 的 事情 时 ， 解 决 方案 突然 浮现 在 了 脑海 当中 。 
当 你 做 饭 的 时 候 , 在 电话 中 和 妈妈 说 话 的 时 候 ， 给 孩子 读 睡 前 故事 的 时 候 ， 你 的 潜意识 正在 逐步 
地 解决 这 个 问题 ， 并 且 它 再 次 显示 了 自己 的 魔力 。 


我 们 所 有 人 都 经 历 过 这 种 事情 : 突然 间 忧 然 大 悟 , 以 EREE eO 
前 模糊 不 清 的 突然 变 得 完全 清晰 了 。 不 好 的 是 没有 办 法 特 Help your subconscious help 
意 设 计 出 这 种 效果 。 有 时 , 你 的 潜意识 会 帮助 你 完成 工作 ， you. 
而 其 他 时 间 它 将 继续 保持 沉默 。 但 是 你 一 定 可 以 做 些 事情 
来 帮助 你 发 挥 潜意识 。 

如 果 你 发 现 自 己 变 得 诅 形 或 超 负荷 了 〈 进 行 了 大 量 工作 却 几 乎 没有 进展 ) ， 这 就 表明 你 需要 
休息 一 下 了 。 换 一 个 问题 做 一 段 时 间 ， 喝 杯 茶 ， 散 散步 ， 娱 乐 一 会 儿 。 任 何 能 把 你 的 思维 从 问题 
中 转移 出 去 的 事情 都 可 以 。 


最 坏 情况 下 ,你 头脑 清醒 地 重新 返回 这 个 问题 ,但 这 回 更 有 可 能 取得 重大 进展 。 最 好 的 情况 
是 ， 如 果 你 幸运 的 话 ， 奇 迹 将 会 发 生 ， 你 的 潜意识 会 帮助 你 完成 工作 。 

如 果 潜 意识 不 期 而 至 ,那么 把 它 写 下 来 。 如 果 没 有 笔 和 纸 ， 那 么 给 你 自己 发 一 条 短信 ， 或 者 
告诉 你 恰巧 遇 到 的 任何 人 一 一 没有 比 第 二 天 想 不 起 来 的 事 更 令 人 诅 形 的 了 。 


如 果 遇 到 特别 困难 的 问题 ， 可 以 多 休息 一 会 儿 。 第 二 天 早晨 起 床 后 ， 看 问题 的 角度 可 能 就 大 
大 不 同 了 ,没准 会 对 解决 问题 起 到 不 可 估量 的 帮助 作用 。 但 要 注意 别 矫 枉 过 正 一 跟踪 一 个 缺陷 
意味 着 你 需要 了 解 很 多 不 同 的 东西 。 休 息 太 长 时 间 后 ， 你 可 能 需要 重新 进入 角色 。 此 外 ,还 有 一 
些 缺 陷 是 没有 解决 捷径 的 ， 只 能 一 鼓 作 气 战斗 到 底 。 


3.5.4 ”做 些 改变 ， 什 么 改变 都 行 
前 面 讨论 过 , 认真 仔细 地 思考 你 的 实验 是 非常 重要 的 。 你 应 该 知道 为 什么 做 这 些 实验 ,你 想 
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通过 它们 得 到 什么 样 的 结果 。 
但 有 时 候 ， 如 果 你 完全 陷入 困境 之 中 ,做 一 点 改变 是 十 分 必要 的 。 任 何 改变 都 可 以 。 也 许 它 
不 会 告诉 你 任何 东西 ， 但 有 时 它 会 让 你 感到 惊奇 一 一 让 你 惊奇 的 事 总 会 教 给 你 一 些 东西 。 
我 想 要 的 东西 根本 没有 出 现 
Bis Fie MEN 
RAUL Bit — MAB, 这 个 缺陷 似乎 是 “一 个 表单 的 多 选 控件 间歇 性 地 不 能 自动 
选择 " 。 它 在 空 值 与 我 想 要 选 的 值 之 间 跳 跃 。 
每 次 我 重 现 问题 的 时 候 ， 都 使 用 同样 的 输入 值 (Fire 和 Health) RAHM ARE 


过 了 一 段 不 知 所 措 的 时 间 后 ， 我 尝试 输入 了 不 同 的 数据 集 (Charities -和 
Probation) 。 结 果 让 我 很 吃惊 ， 它 仍然 断断续续 取 Fire 和 Health 中 的 一 个 值 或 者 为 
空 。 这 个 问题 和 默认 设置 没有 任何 关系 ,是 因为 表单 被 缓存 了 (在 2 台 不 同 的 服务 器 上 )。 
我 原来 没有 找到 这 个 原因 ， 是 因为 我 总 是 选择 相同 的 选项 。 


3.5.5 ”福尔摩斯 原则 


STS SE EST Voce cae 
k, RRBOTOLAA, BH ”无 论 剩 下 的 是 什么 ,无 论 它 有 多 么 不 可 思议 ， 它 也 一 定 是 


AiR, 
When you have eliminated 这 是 一 种 宝贵 的 提醒 ， 虽 然 多 数 情 况 下 最 有 可 能 得 到 


the impossible, whatever remains, 的 是 简单 解释 但 是 有 时 事情 的 真相 真是 不 可 思议 。 有 时 ， 
Serene ents 太阳 系 所 有 的 行星 真 的 以 正确 的 方式 排列 成 行 。 不 要 只 是 
因为 一 个 解释 感觉 太 不 可 能 为 真 而 拒绝 它 。 
它 永 远 是 大 管家 
PEREZ’ K 
我 的 Ruby on Rails 应 用 程序 中 的 一 个 控制 器 声明 其 startO 方 法 不 存在 。 这 段 代码 
已 经 几 个 月 没有 改动 了 , 我 可 以 在 源 代码 中 看 到 方法 的 定义 。 那 么 ， 是 什么 妨碍 了 Rails 
找到 这 个 方法 呢 ? 
我 启用 了 我 认为 可 靠 的 调试 器 ， 对 ActionController 进行 了 逐步 调试 。 出 于 安全 
考虑 ， 并 非 所 有 的 方法 都 作为 action ， 因 此 Rails 清除 了 所 有 定义 在 Action- 
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Controller::Base 中 的 内 容 。 由 于 某 些 原因 ，ActionController::Base 突然 获得 了 一 
个 名 为 startQ 〇 的 方法 一 一 迷 局 解 开 了 。 


我 找 不 到 这 个 startO 〇 方法 来 自 何 处 。 它 肯定 不 在 源 代码 中 。 我 启动 了 交互 式 控 制 
台 来 作 一 下 深入 的 调查 ， 更 加 奇怪 了 一 一 没有 startQ 〇 方法 ， 即 使 我 运行 同样 的 代码 也 
没有 。 

在 经 过 了 大 量 的 调试 并 且 无 计 可 施 时 ， 突 然 间 我 想到 问题 是 不 是 调试 器 本 身 产生 
的 。 我 看 了 一 下 调试 器 的 源 代码 ， 果 然 ， 它 定义 了 Kerne1#start() 方 法 ， 这 个 方法 又 
引入 到 ActionController 中 。 因 此 ， 造 成 了 action 的 时 有 时 无 ， 看 似 随 机 的 因素 其 实 
取决 于 我 是 否 调 试 了 其 他 的 代码 。 


3.5.6 ”坚持 


虽然 有 时 看 起 来 不 是 这 样 , 但 实际 上 任何 一 个 缺陷 都 是 可 以 被 诊断 的 。 运 行 在 计算 机 上 的 任 
何 软件 都 是 人 类 创造 的 , 我 们 可 以 随时 提取 足够 的 信息 来 准确 地 了 解 它 的 运行 状况 。 从 这 个 角度 
来 说 ， 软 件 儿 乎 和 人 类 从 事 的 任何 一 个 其 他 领域 都 有 所 不 同 。 


当然 ， 这 绝 不 意味 着 诊断 很 简单 。 当 你 对 自己 究竟 会 不 会 弄 清 目前 的 问题 感到 绝望 时 ， 请 记 
住 ， 总 有 一 个 方法 可 以 帮 你 解决 问题 。 只 要 有 足够 的 时 间 ， 付 出 足够 的 精力 和 决心 ， 你 一 定 会 解 
决 问题 的 。 


3.6 ”验证 诊断 


我 们 人 类 是 多 才 多 艺 的 动物 。 不幸 的 是 , 我 们 的 才能 之 一 是 自欺欺人 一 一 如 果 想 要 什么 是 真 
的 ,我 们 就 非常 善于 使 自己 相信 这 些 是 真 的 。 考 虑 到 这 一 点 , 花 时 间 验 证 你 的 诊断 是 否 真 正 站 得 
住 脚 是 很 值 当 的 。 
口 向 其 他 人 解释 你 的 诊断 。 他 们 可 能 会 发 现 一 个 缺陷 ， 即 使 是 旁观 者 效应 也 可 以 发 挥 其 神 
奇 的 作用 来 帮助 你 达到 这 样 的 效果 。 

O 检查 源 代码 的 原始 副本 ， 不 要 带 上 你 所 做 的 任何 修改 ， 验 证 你 编程 时 的 分 析 仍 然 正确 。 
你 可 能 已 经 注意 不 要 引入 任何 意外 的 不 良 结果 , 但 是 只 有 从 一 个 已 知 的 没有 问题 的 副本 
代码 重新 开始 ， 才 能 让 你 对 成 功 抱 有 信心 。 

o 既然 你 明白 了 这 个 问题 ， 有 没有 其 他 方法 可 以 证 明 它 确实 以 你 设想 的 方式 进行 工作 ? BR 

试 试 。 你 看 到 了 预期 效果 了 吗 ? 
O 多 和 他 人 讨论 ， 并 假设 你 是 错 的 。 知 道 你 犯 过 什么 错误 了 吗 ? 
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这 些 检查 和 平衡 不 会 花费 很 长 时 间 , 我 只 是 希望 它们 能 说 服 你 最 终 你 是 对 的 。 如 果 没 有 , 那 
么 ， 它 们 可 以 使 你 免 受 尴 论 并 节省 时 间 ， 确 实 非常 值得 一 试 。 


既然 有 了 一 个 你 信任 的 诊断 ， 所 有 剩 下 的 工作 就 是 进行 修复 , 而 这 正 是 我 们 将 在 下 一 章 讲述 
的 内 容 。 


3.7 (IRITI 
O 构建 假设 ， 并 用 实验 来 测试 它们 。 
n 确保 自己 明白 你 的 实验 要 说 明 什么 。 
每 次 只 做 一 个 修改 。 
a 把 你 尝试 过 的 工作 记录 下 来 。 
n 不 要 忽略 任何 事物 。 
o 当 事 情 并 不 顺利 的 时 候 ， 做 到 以 下 几 点 。 
m 如 果 你 做 的 修改 似乎 没有 产生 效果 ， 那 么 你 就 没有 改 到 点 子 上 。 
m 验证 你 的 假设 。 
n 你 是 否 面临 多 个 有 内 在 联系 的 原因 或 一 个 不 断 变 化 的 基本 系统 ? 
a 验证 你 的 诊断 。 


4s 
修复 缺陷 





到 这 里 ,问题 的 诊断 就 完成 了 。 现 在 可 以 庆贺 一 下 了 一 一 很 可 能 你 已 经 完成 了 任务 中 最 困难 
的 部 分 。 既 然 知道 了 问题 的 所 在 ， 修 复 它 应 该 是 一 件 轻而易举 的 事 。 

但 是 , 还 是 要 小 心 。 到 目前 为 止 , 你 的 工作 重点 一 直 是 在 努力 弄 清 楚 软件 究竟 是 怎样 运行 的 ， 
以 及 它 为 什么 会 出 现 问 题 。 你 已 经 创建 了 特定 的 实验 , 修改 了 代码 来 插入 日 志 功 能 , 找到 出 错 条 件 ， 
或 者 通过 其 他 方式 使 软件 按照 你 的 要 求 运 行 。 在 思考 问题 的 时 候 ， 你 已 经 形成 了 一 个 谨慎 并 具有 创 
造 性 的 、 开 放 的 思想 方式 ， 随 后 你 已 对 不 同 的 假设 进行 了 论证 和 反 向 论证 。 

现在 ， 你 即将 开始 一 个 完全 不 同 的 实验 。 一切 都 可 以 运行 ” 式 的 诊断 会 被 更 加 专业 化 的 、 
结构 化 的 方法 所 取代 ， 这 些 方法 需要 对 代码 进行 高 质量 的 、 精 确 的 、 可 靠 的 修改 。 总 之 ， 你 现在 
已 经 不 是 一 个 寻找 缺陷 的 探测 者 了 ， 是 时 候 再 次 成 为 一 名 软件 工程 师 了 。 


当然 , 你 的 主要 目标 是 修复 问题 。 但 是 对 于 一 个 好 的 
修复 来 说 , 不 仅仅 是 让 软件 正确 运行 一 你 还 需要 为 将 来 。 下 pe wy > ， 
芮 定 良好 的 基础 。 如 果 不 小 心 , 软件 可 能 会 取得 相反 的 效 Te bear 
果 ， 也 就 是 常 说 的 “比特 腐 坏 ”(bitrot) 的 状态 中 。 一 次 than just making the software 
次 修复 ,一 系列 零散 的 未 经 过 仔细 考虑 的 修改 , 都 将 使 原 behave correctly. 
本 简洁 的 设计 逐渐 消失 。 


在 这 一 章 中 ， 我 们 将 探讨 如 何 同时 实现 以 下 目标 : 


O 修复 问题 
O 避免 引入 回归 ， 
o 维持 或 提高 代码 的 整体 质量 (可 读 性 、 架 构 、 测 试 覆 盖 率 和 性 能 等 )。 


4.1 清除 障碍 
在 深入 解决 问题 之 前 ， 有 些 基础 工作 是 必须 要 做 的 。 第 一 步 就 是 要 确保 一 切 重新 开始 。 
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当 出 现 问 题 时 , 你 很 可 能 匆忙 地 修改 了 源 文件 并 且 重 新 进行 了 配置 ， 并 创建 了 实验 ,把 数据 
文件 散落 得 到 处 都 是 。 你 表 定 不 想 突 然 地 签 入 这些 随机 的 修改 。 如 果 不 在 签 入 之 前 弄 清楚 问题 ， 
你 会 面临 难以 将 它们 区 分 开 来 的 危险 。 


但 是 ， 你 不 想 轻易 地 抛弃 一 切 ， 因 为 你 所 做 的 一 些 修改 或 者 你 在 诊断 阶段 创建 的 数据 文件 ， 
很 有 可 能 会 为 测试 用 例 的 编写 奠定 良好 的 基础 ， 而 这 些 测 试用 例 又 是 修复 缺陷 的 一 部 分 。 此 时 ， 
你 的 源 代码 控制 系统 照例 很 有 用 处 。 


首先 ， 你 需要 对 所 做 的 修改 进行 快速 审核 。* 不 要 跳 过 这 -一步 。 经 常 发 现 这 些 已 经 忘记 的 修 
改 会 让 你 惊讶 不 已 。 
一 一 人 一 个 了 WRBR 丰 宙 一 通常 情况 下 ， 丢 弃 这 些 修改 将 是 正确 的 选择 。" 然 而 ， 

Start from a clean source ”如 果 要 留 住 这 些 修改 ,不 要 把 它们 贸 在 原 地 并 修改 附近 的 
tres: 代码 。 请 记 住 ， 我 们 的 目标 之 一 是 避免 回归 ， 这 些 修改 不 
是 以 这 样 的 方式 存在 意味 着 它们 是 可 以 信任 的 。 随时 做 记录 , 或 保留 相关 文件 的 副本 , 但 是 当 你 开 
始 实施 一 个 修复 程序 时 ,从 一 个 干净 的 代码 树 开始 是 很 关键 的 .如 果 在 诊断 阶段 所 作 的 修改 很 深入 ， 
你 甚至 可 以 更 方便 地 将 整个 新 源 代码 树 进 行 更 新 ， 并 把 错误 的 代码 树 放 在 旁边 作为 参考 。 


这 给 了 你 一 个 值得 信赖 的 起 点 。 接 下 来 要 考虑 的 事情 是 , 如何 去 证 明 你 的 修复 确实 解决 了 遇 
到 的 问题 。 


4.2 测试 


假设 你 的 开发 过 程 包括 测试 优先 (或 测试 驱动 ) 开发 ， 因 此 你 拥有 一 个 自动 化 的 测试 框架 和 
大 量 的 单元 测试 工具 。 现 在 ， 当 你 要 对 源 代码 作出 更 改 时 ， 这 种 方法 确实 能 够 收 到 良好 的 效果 。 
你 不 仅 可 以 用 它 来 确保 你 的 修复 程序 会 解决 此 问题 ， 而 且 它 为 避免 卷 人 回归 提供 了 很 好 的 保障 。 


人 有 因为 你 要 依靠 大 量 的 测试 ， 首 先 确保 它们 都 通过 ( 当 
aie, 然 应 该 是 这 样 ， 因 为 你 刚刚 确保 了 使 用 的 是 干净 的 源 代码 

Start by ensuring that oh 树 )。 如 果 它 们 没有 全 部 通过 ， 请 立即 停止 ,并 找 出 原因 。 
AOUT tests POSS 或 许 因 为 同事 签 入 了 一 个 有 缺陷 的 更 改 ? 或 者 你 的 本 地 
环境 配置 不 正确 ? 无 论 如 何 ， 如 果 测 试 没有 通过 ， 就 不 能 帮助 你 进行 即将 作出 的 更 改 。 





@ 签 入 ， 用 在 版 本 控制 中 ， 是 指 当 某 个 人 修改 完 代码 后 ， 就 签 入 到 版 本 控制 软件 中 ， 别 的 人 才能 获取 最 新 版 本 。 
一 一 译 者 注 


@ 如 果 你 使 用 Subversion， 可 以 在 svn diff 命令 后 使 用 svn status 命令 。 
@ 使 用 svn revert -recursive 命令 。 
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测试 优先 开发 的 规则 之 一 是 ， 直 到 有 一 个 失败 的 测试 时 ， 才 应 该 更 改 源 代 码 。 因 此 ， 你 需要 
证 明 你 已 经 拥有 了 通过 所 有 测试 的 测试 套件 作为 坚实 的 基础 ， 同 时 最 好 确保 有 一 个 失败 的 案例 。 


如 果 缺 陷 被 遗漏 了 ,很 显然 , 要么 现 有 的 测试 程序 未 能 充分 地 测试 有 问题 的 功能 ， 要 么 测试 
程序 本 身 就 有 问题 。 因 此 ， 要 么 需要 增加 一 个 或 多 个 新 的 测试 程序 ， 要 么 修复 已 有 的 测试 程序 。 


下 面 是 应 该 采用 的 顺序 。 


O 运行 现 有 的 测试 程序 ， 并 证 明 它 们 能 通过 。 

(2) 添加 一 个 或 多 个 新 的 测试 程序 ， 或 修复 现 有 的 测试 程序 ， 以 显示 错误 〈 换 名 话说， 就 是 
失败 )。 

(3) 修复 缺陷 。 

(4) 证 明 你 的 修复 起 了 作用 (那些 失败 的 测试 不 再 失败 )。 

(5) 证 明 你 没有 引入 任何 回归 (以 前 通过 的 所 有 测试 现在 都 没有 失败 )。 


当然 , 现实 中 , 根据 缺陷 修复 的 复杂 程度 , 测试 的 过 程 不 一 定 是 按照 上 面 的 顺序 线性 进行 的 。 
你 可 能 要 在 建立 测试 和 修改 代码 间 反 复 多 次 ， 才 能 确定 最 终 解 决 方案 。 


你 创建 的 用 来 重 现 和 诊断 问题 的 实验 、 数 据 文件 以 及 其 他 任何 东西 形成 了 丰富 的 思想 源泉 。 
事实 上 ， 如果 运气 好 ， 所 有 你 需要 做 的 就 是 整理 并 规范 好 你 所 创建 的 东西 。 但 是 请 记 住 ,我 们 要 
的 是 具有 产品 质量 的 东西 。 当 你 没有 真正 理解 问题 的 时 候 , 创建 的 测试 也 有 可 能 是 一 个 很 好 的 出 
发 点 ， 但 是 你 应 该 花 些 时 间 来 确保 它们 得 到 了 很 好 的 构建 ， 并 且 测 试 了 一 切 应 该 测试 的 东西 。 


如 果 不 采 用 测试 优先 的 开发 过 程 呢 ? 即使 这 样 ， 测 试 人 
仍然 是 至 关 重 要 的 。 如 果 你 没有 一 个 可 靠 的 测试 来 证 明 问 ” 前， 确保 你 已 充 知 道 妈 何 迁 行 
题 的 存在 ， 如 何 确保 你 已 经 解决 问题 了 呢 ? EEK MRT. 

是 ， 你 可 能 是 用 手动 的 而 不 是 自动 化 的 方式 来 进行 测试 ， Make sure you know how 
而 且 测 试 结束 后 就 丢弃 了 。 在 缺少 回归 测试 的 情况 下 你 必 XW re going to test it before 
须 非常 谨慎 ， 因 为 意外 引入 一 个 回归 的 机 会 要 高 许多 。 iania your fia 


测试 套件 如 何 挽救 了 我 
FRE KRM 

我 过 去 一 直 用 PHP 编写 应 用 程序 。 幸 好 我 们 有 一 个 用 途 广泛 的 自动 化 测试 套件 。 
我 作 了 修改 (一 个 非常 简单 的 更 改 )， 结 果 ， 在 一 个 我 没有 接触 过 的 Web 服务 接口 测试 
时 出 现 问题 了 。 我 所 作 的 修改 肯定 与 它 无 关 。 


Re 
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原来 ， 测 试 失败 的 原因 是 Web 服务 返回 无 效 的 XML 文档 。 我 查看 了 XML 文档 ， 
看 起 来 没有 什么 问题 。 我 不 是 XML 大 师 ， 所 以 我 找 了 一 个 同事 去 分 析 ， 他 也 说 没有 问 
题 。 我 一 直 听 人 说 XML 是 比较 简单 的 ， 所 以 应 该 不 难看 出 其 是 不 是 正确 的 。 


最 后 我 在 XML 文档 的 开头 找到 了 一 个 换行 符 ， 这 在 XML 里 是 违法 的 ， 因 此 报告 
XML 文档 无 效 。 


怎么 会 出 现 换行 符 呢 ? 嘿 ， 我 不 小 心 将 一 个 换行 符 添加 到 文件 末尾 的 <php> 结 束 标 
记 后 面 。 其 结果 是 ，PHP 处 理 器 把 它 当 作 HTML 的 一 部 分 发 送 到 “浏览 器 "。 


一 般 而 言 ， 一 个 多 余 的 换行 符 不 会 产生 任何 影响 。 然 而 ， 当 PHP 代码 被 添加 到 在 
Web 服务 代码 路 径 中 时 ， 换 行 符 在 其 余 XML 文档 之 前 出 现 ， 这 导致 了 XML 无 效 。 


如 果 没 有 自动 测试 , 程序 也 许 就 会 当 作 产品 发 布 了 ,然后 再 不 得 不 送 回来 以 弄 清 楚 
为 什么 某 部 分 服务 会 出 现 问 题 。 


43 ”修复 问题 产生 的 原因 ， 而 非 修 复 现 象 


几 年 前 , 我 用 C 语 言 编写 嵌入 式 代码 时 ,跟踪 到 某 个 函数 出 现 的 缺陷 。 该 函数 类 似 于 如 下 代 
码 ; 


int process_items(item* item array, int array_size) 
{ 


int i; 


/* 不 知 何故 ， 传 人 的 array_size 会 差 1， 这 里 给 它 加 上 */ 


array_size++; 


for(i = 0; i < array_size; i++) { 
«Process item_array[i]» 
} 
} 


这 名 开发 人 员 (我 就 不 提名 字 了 ) 几 个 月 前 就 已 经 确定 是 因为 array_size 错误 赋值 而 产生 
了 缺陷 。 然 而 ， 他 没有 继续 分 析 确定 调用 该 函数 时 传递 错误 参数 值 的 原因 ， 而 是 通过 修改 这 个 函 
数 的 内 容 来 解决 这 个 问题 。 

果然 ， 我 随后 发 现 ，process_items() 方 法 可 能 在 多 个 位 置 被 调用 ， 但 偶尔 array_size 的 
值 也 是 对 的 ， 这 就 会 导致 数组 溢出 〈C 语言 ) 问题 ， 而 这 个 问题 又 导致 稍 后 出 现 了 一 些 令 人 费解 
的 问题 ， 需 要 花费 相当 大 的 精力 去 跟踪 。 
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W 小 乔 爱问 
过 “ 掉 盖 真相 ”到 底 会 不 会 有 问题 呢 


有 时 即使 我 们 明白 问题 的 根源 ， 还 是 有 可 能 “掩盖 真相 ”。 这 么 做 的 原因 有 以 下 几 点 : 
(1) 这 个 缺陷 是 深 深 植 根 于 结构 的 ， 彻 底 修 复 这 个 缺陷 将 涉及 大 面积 的 修改 ， 而 且 很 危险 ; 
(2) 会 带 来 与 以 前 版 本 是 否 兼容 的 风险 ( 见 8.2 节 ); (3) 做 一 次 真正 的 修复 比 更 新 一 个 好 
的 应 用 补丁 需要 付出 更 多 的 精力 。 


然而 ,这 是 一 本 重 实效 的 书 ， 因 此 ， 必 须 承认 有 时 这 不 是 正确 的 方法 ， 不 过 这 种 情况 确 
实 非常 军 见 。 


每 一 次 决定 不 解决 问题 的 根源 的 时 候 ,的 确 是 大 大 降低 了 代码 库 的 整体 质量 。 不 仅 如 此 ， 
这 还 会 产生 不 好 的 心理 影响 ( 见 7.1 节 )。 


RH, 有 些 时 候 ， 选 择 不 解决 根本 问题 对 我 们 来 说 可 能 更 为 合适 ， 但 是 这 只 能 作为 最 后 
没有 办 法 的 办 法 ， 而 且 还 必须 睁 大 双眼 防止 后 患 。 





但 这 种 事情 会 频频 发 生 。 我 们 所 有 人 都 将 在 职业 生涯 中 的 某 些 时 候 发 现 自己 在 跟踪 这 样 的 
缺陷 。 


促使 我 们 最 终 犯 了 这 种 错误 的 原因 有 两 个 。 最 常见 的 是 因为 我 们 的 分 析 远 远 不 够 ,还 没有 发 
现 问 题 的 真正 根源 。 但 有 时 是 由 于 无 法 应 对 时 间 进 度 方面 的 压力 所 导致 的 。 


首先 关注 一 下 时 间 进 度 方面 的 压力 。 在 某 个 地 方 ,一 个 软件 工程 项 目 可 能 在 没有 固定 的 时 间 
进度 压力 的 情况 下 运作 着 。 不 过 迄今 为 止 我 还 从 来 没有 从 事 过 这 样 的 项 目 。 即 使 你 足够 幸运 , 在 
这 种 情况 下 工作 ， 受 你 缺陷 影响 的 用 户 也 不 可 能 愿意 为 了 你 修复 缺陷 而 多 等 一 分 钟 。 


其 结果 是 ， 你 很 可 能 会 迫 于 压力 而 只 是 “让 缺陷 消失 ”， 然 后 去 进行 下 一 个 任务 。 在 平时 可 
以 信和 上 换 旦 旦 地 说 绝 不 做 这 样 的 事情 , 但 在 非常 时 期 , 一 边 是 愤怒 的 用 户 在 向 你 大 喀 大 叫 ， 一边 是 
不 耐烦 的 项 目 经 理 给 你 脸色 ， 你 就 很 可 能 做 这 样 的 事 。 


无 论 这 么 做 有 多 不 好 ， 比 起 在 完全 了 解 问题 的 根本 原因 之 前 就 进行 修复 的 风险 ,都 是 微 不 足 
道 的 。 至少 ， 如 果 你 了 解 根 本 原因 ， 采 取 一 个 明智 的 (即使 被 误导 了 的 ) 决定 并 迅速 地 实施 解决 
方案 , 你 是 了 解 你 所 做 事情 的 意义 的 。 如 果 你 并 未 真正 了 解 程序 的 运行 状况 ， 那 么 根本 就 不 可 能 
预测 到 你 的 行动 会 带 来 什么 样 的 后 果 。 
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回想 一 下 ,解决 当前 这 个 问题 只 是 我 们 制订 的 三 个 目标 之 一 。 我 们 还 需要 避免 引入 回归 并 保 
持 代码 的 整体 质量 。 我 们 的 重点 往往 是 第 一 个 目标 ,但 后 两 个 同样 重要 (从 长 远 来 看 ， 可 能 更 重 
要 )。 考 虚 到 这 一 点 ， 做 一 些 自己 尚 不 理解 的 改变 是 十 分 不 明智 的 。 


你 怎么 知道 你 真正 了 解 了 问题 的 根源 ?好 吧 ， 要 用 到 一 些 经 验 法 则 。( 例 如 ， 给 同事 解释 这 
个 会 理直气壮 吗 ? 解释 时 会 用 “由 于 某 种 原因 ……” 或 “我 不 知道 为 什么 , 但 是 ……” 这 样 的 短 
语 吗 ? ) 但 是 , 这 个 问题 最 简单 的 事实 是 ， 大 部 分 情况 下 你 知道 自己 是 否 了 解 问题 的 根源 。 这 就 
是 所 谓 的 学 术 诚 实 一 一 勇于 正确 对 待 自 己 ， 即使 你 似乎 找到 了 一 种 修复 缺陷 的 方法 , 但 如 果 你 还 
不 能 够 确信 自己 是 否 真正 理解 了 问题 的 症结 所 在 ， 那 么 你 也 不 能 相信 你 的 修复 。 
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最 近 的 几 年 里 , 敏捷 开发 方法 的 日 益 普及 给 软件 开发 带 来 了 巨大 的 变化 。 对 于 代码 结构 (而 
非 项 目 管理 ) 而 言 ， 最 显著 的 影响 就 是 两 种 技术 的 广泛 应 用 一 一 自动 化 测试 和 重 构 技术 。 


重 构 是 改善 既 有 代码 的 设计 而 不 改变 其 行为 的 过 程 。 后 者 有 时 会 被 忽视 ， 但 却 是 这 里 我 们 
主要 关心 的 方面 。 对 于 重 构 的 完整 介绍 ， 请 参考 Martin Fowler 的 经 典 著 作 《 重 构 ， 改 善 既 有 代 
码 的 设计 》?。 | 

修复 缺陷 往往 不 会 涉及 重 构 。 你 正在 使 用 的 代码 中 包含 缺陷 , 这 一 事实 本 身 往往 意味 着 代码 
本 应 得 到 更 简洁 或 更 好 的 构建 。 你 很 有 可 能 会 找到 哪些 代码 能 够 改进 。 


而 且 ， 如 果 缺 乏 经 验 的 话 ， 在 为 修复 缺陷 而 作出 必要 的 修改 时 会 产生 重复 ， 而 这 些 重复 是 不 
应 该 有 的 。( 这 就 是 《程序 员 修炼 之 道 》 一 书 中 描述 的 “不 要 重复 你 自己 ”(Don'tRepeat Yourself, 
DRY) 的 原则 。 

执行 这 些 重 构 和 修复 缺陷 同样 重要 (请 记 住 ， 我 们 的 目标 之 一 是 维持 或 提高 代码 的 整体 质 
量 )。 有 时 候 在 修复 缺陷 之 后 重 构 比 先 重 构 再 修复 更 合理 (因为 这 样 做 可 以 使 你 更 容易 修复 缺陷 )。 
有 时 ， 当 从 事 一 项 特别 复杂 的 修复 工作 时 ， 你 会 反复 地 经 历 重 构 和 缺陷 修复 。 


Hilal inert arte 但 是 记 住 ， 重 构 的 同时 绝 不 能 改动 代码 功能 ， 同 样 也 
REGS, BARGE, WD = reais 
AMORLG, 人 

Refactor or change functiona- 由 此 引出 修复 缺陷 时 进行 源 代码 控制 的 话题 。 


lity—one or the other, never both. 


O 该 书 中 英文 版 均 已 由 人 民 邮 电 出 版 社 出 版 。 一 一 编者 注 
© 该 书 中 文 版 由 电子 工业 出 版 社 出 版 ， 英 文 注释 版 由 人 民 邮 电 出 版 社 出 版 。 一 一 编者 注 


45 EA 4 57 


W 小 乔 爱问 
X 重 构 的 关键 是 什么 


很 多 第 一 次 接触 看 构 的 人 对 重 构 的 反应 是 “ 那 又 怎样 " 。 这 只 不 过 是 代码 的 “整理 "， 这 
些 代码 已 被 先期 的 程序 员 做 得 差不多 了 。 当 然 ， 在 Martin Fowler 写作 《 重 构 》 一 书 时 ， 某 
种 程度 上 他 所 做 的 一 切 就 是 将 已 被 开发 者 使 用 了 多 年 的 技术 进行 重新 编目 。 


但 是 重 构 不 仅仅 是 一 项 有 用 的 技术 编目 ， 其 中 还 包含 Fowler 的 两 个 关键 见解 。 
OQ 只 有 在 一 个 全 面 的 单元 测试 套件 的 安全 网 中 才 可 以 安全 地 修改 既 有 代码 。 


口 我 们 不 应 该 在 试图 重 构 代码 的 同时 改变 其 行为 。 

换 身 话说 ， 你 可 以 修改 代码 的 行为 ， 也 可 以 重 构 它 ， 但 不 能 同时 做 这 两 件 事 。 

经 过 反思 , 很 容易 理解 为 什么 是 这 样 。 假设 你 试图 在 重 构 代码 的 同时 改变 其 行为 ,这 样 
做 后 ， 有些 测试 可 能 会 失败 。 这 可 能 表明 你 在 修改 结构 时 犯 了 一 个 错误 。 或 者 ， 它 可 能 是 功 
能 修改 的 预期 结果 。 然 而 ,很 难 确定 是 哪 一 个 。 对 功能 或 结构 的 修改 越 复 杂 ， 就 越 难 以 确定 
失败 原因 。 

只 修改 代码 或 只 重 构 ， 就 可 以 避免 测试 失败 ， 从 而 充满 信心 地 对 大 改动 的 代码 开展 | 
重 构 。 





4.5 签 入 


源 代码 控制 系统 是 我 们 的 武器 库 中 最 有 力 的 武器 。 但 是 如 果 运 用 不 当 , 会 失去 它 的 很 多 价值 。 


我 们 很 容易 将 很 多 错误 集合 起 来 ,将 它们 一 站 式 签 入 。 毕 况 这 样 做 可 以 一 鼓 作 气 解决 所 有 问 
题 ， 打 破 这 个 过 程 就 太 可 惜 了 。 但 这 样 做 会 大 大 降低 源 代 码 控制 工具 的 作用 。 

从 调试 的 角度 来 看 ， 源 代码 控制 的 主要 价值 是 审核 记录 。 如 果 有 人 确实 引入 一 个 回归 ， 你 可 
以 通过 对 以 前 的 修改 进行 查询 ( 见 3.2 节 ) 来 准确 地 找到 哪个 修改 导致 了 回归 (因此 是 你 需要 修 
正 的 )。 但 是 ， 这 种 方法 的 有 效 性 与 每 次 签 人 的 规格 大 小 成 反比 。 如 果 存 在 问题 的 签 人 包含 了 对 
散落 在 整个 项 目的 数 百 个 文件 的 更 改 ， 那 么 即便 发 现 是 这 一 次 签 人 导致 了 缺陷 也 是 没有 用 的 。 

为 了 训 免 出 现 这 个 问题 , 请 坚持 如 下 原则 : 一 次 逻辑 “7 eeRR aOR 
修改 只 做 一 次 签 入。 Pe 

One logical change, one 
对 于 简单 的 修复 ,这 意味 着 需要 一 次 单独 的 签 入 , 1H check-in. 
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大 多 数 情况 下 会 涉及 多 个 逻辑 修改 (因此 需要 多 次 签 入 )。 如 果 修复 程序 需要 2 个 逻辑 上 独立 的 功 
能 修改 和 2 个 独立 的 重 构 ， 这 可 能 意味 着 4 次 独立 的 签 人 。 


与 以 往 一 样 ， 你 应 该 自己 判断 。 即 使 3 次 签 入 彼此 独立 ， 对 需要 3 个 单线 更 改 的 修复 使 用 3 
次 签 人 也 可 能 矫 枉 过 正 了 。 但 是 如 果 能 早 些 并 且 经 常 性 地 签 人 ， 你 就 会 少 走 些 焉 路 。 请 记 住 ， 确 
保 你 的 签 入 意见 尽 可 能 具体 是 有 意义 ， 会 让 人 受益 菲 浅 。 


最 后 点， 无论 修正 缺陷 或 实现 新 的 功能 ， 每 次 签 入 
AENTARIRB. 之 前 一定 要 弄 清 想 你 要 签 和 的 是 什么 ， 这 是 很 好 的 习 愉 。 
这 个 过 程 不 会 花 太 长 时 间 ， 并 且 偶尔 还 会 有 意外 收获 , 可 





能 发 现 计划 外 的 变化 。 


46 ”审查 代码 


不 管 多 么 小 心 , 你 都 有 可 能 制造 出 一 个 让 事情 变 糟 而 不 是 变 好 的 修复 。 尤 其 是 当 它 涉及 代码 
质量 和 可 维护 性 的 时 候 ， 即 使 进行 再 多 的 测试 〈 自 动 化 或 以 其 他 方式 ) 也 无 法 保证 不 犯错 。 正 式 
或 非 正式 的 代码 审查 是 个 好 办 法 ， 可 以 在 问题 产生 永久 性 的 损害 之 前 就 发 现 它 。 


代码 审查 是 一 些 开 发 方法 中 固有 的 一 部 分 。 例 如 ， 通 过 结对 编程 ，XP (极限 编程 ) 可 以 保 
证 每 个 更 改 都 有 2 个 人 进行 检查 。 不 过 ， 不 必 把 代码 审查 看 作 一 个 很 正式 的 调试 方法 。 


审查 人 和 审查 时 间 

代码 审查 没有 固定 的 执行 时 间 。 有 时 可 以 让 同事 参与 到 修复 的 初期 阶段 , 有 时 可 能 只 是 让 他 
们 在 一 个 完成 的 更 改 上 签字 确认 。 

经 验 告诉 我 们 ， 无 论 什么 时 候 遇 到 具有 不 确定 性 或 有 风险 的 区 域 ， 都 要 做 审查 。 请 记 住 ， 审 
查 不 是 一 锤子 买卖 一 只 要 合情合理 ， 没 有 规定 说 你 不 可 以 反复 地 求助 。 


无 论 让 谁 来 进行 审查 , 你 都 可 能 受益 匪 浅 。 仅 是 让 另 一 个 人 来 检查 你 的 工作 就 已 经 向 前 迈进 
了 一 大 步 。 如 果 你 在 一 个 相对 陌生 的 领域 工作 ,去 向 更 熟悉 这 个 领域 的 人 【比如 代码 作者 ) 讨教 
会 更 好 一 些 。 相反 , 如 果 你 很 了 解 程序 代码 , 那么 找 一 个 对 此 不 熟悉 的 人 来 获得 一 个 新 的 视角 吧 。 


成 功 地 修复 缺陷 是 一 个 伟大 的 里 程 碑 , 但 它 不 意味 着 结束 。 着 手下 一 个 任务 之 前 , 花 点 儿 时 
间 思 考 第 一 次 缺陷 是 如 何 出 现在 软件 里 的 。 别 的 地 方 的 其 他 实例 是 否 有 相同 的 问题 呢 ? 它 可 能 再 
次 发 生 吗 ? 





4.7 


付 诸 行动 


O 缺陷 修复 包括 以 下 三 个 目标 。 


= 修复 问题 。 
= 避免 引入 回归 。 
m 维持 或 提高 代码 的 整体 质量 (可 读 性 、 架 构 、 测 试 覆 盖 率 等 )。 


DO 从 一 个 干净 的 源 代码 树 开 始 。 


口 


口 


确保 通过 测试 后 再 做 修改 。 
明确 在 做 出 更 改 之 前 如 何 测试 修复 。 


Ch 针对 缺陷 的 原因 而 不 是 现象 进行 修复 。 
O 要 做 重 构 ， 但 永远 不 要 与 功能 修改 同时 进行 。 


口 


-次 逻辑 修改 只 做 一 次 签 人 。 


4.7 付 诸 行动 < 59 


W 
Or 
Hk 


R ie 


缺陷 修复 天 生 是 目标 极其 明确 的 。 我 们 在 处 理 的 是 非常 具体 的 问题 ,很 有 可 能 的 一 种 情况 是 ， 
修复 过 程 涉及 一 个 孤立 出 来 的 代码 区 。 尽 管 关注 的 范围 如 此 狭 窗 ,但 是 你 还 是 需要 有 大 局 观 。 为 
此 ， 你 修复 完 缺 陷 之 后 非常 有 必要 花 些 时 间 去 反思 一 下 。 


在 这 一 章 中 ， 我 们 将 考虑 以 下 几 点 。 
D 这 到 底 是 怎么 搞 的 ? 


9 这 些 问 题 是 何 时 以 及 为 何 被 遗漏 的 ? 
o 确保 问题 不 再 发 生 。 


5.1 这 到 底 是 怎么 搞 的 


每 隔 一 段 时 间 我 的 收 件 箱 中 就 会 收 到 一 封 标 题 很 幽默 的 电子 邮件 ,名 为 “缺陷 调试 的 六 个 阶 
段 "， 内 容 如 下 。 

(1) 缺陷 不 可 能 发 生 。 

(2) 缺陷 没有 发 生 在 我 的 机 器 上 。 

(3) 缺陷 不 应 该 发 生 。 

(4) 为 什么 会 发 生 ? 

(S) 嗅 ， 我 知道 了 。 

(6) 这 到 底 是 怎么 搞 的 ? 

如 同 大 多 数 的 幽默 一 样 ， 我 们 觉得 滑 移 是 因为 它 反映 了 现实 情况 。 特 别 是 ， 你 经 常会 在 完成 
诊断 之 后 还 在 想 :“ 这 到 底 是 怎么 搞 的 ? ” 


如 果 你 发 现 自己 在 这 么 想 , 就 请 稍微 暂停 一 下 。 这 在 很 大 程度 上 表明 你 还 没有 真正 完全 了 解 
缺陷 所 揭示 的 东西 。 继 续 思考 下 去 ， 弄 明白 它 究竟 是 怎么 搞 的 ,你 极 可 能 会 在 这 个 过 程 中 学 习 到 
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很 多 东西 。 
并 不 是 想象 中 的 那么 安全 


我 们 有 一 套 Web 应 用 程序 ， 这 些 程序 将 安全 保护 措施 委托 给 共享 的 “看 守 人 ” 程 
E, 人 们 只 用 一 个 用 户 名 和 密码 就 能 登录 所 有 的 程序 。 如 果 用 户 已 登录 到 这 套 应 用 程序 
中 的 任何 一 个 , 他 们 不 需要 再 次 登录 就 可 以 使 用 其 他 应 用 程序 , 所 有 这 些 都 由 用 户 浏览 
器 中 存储 的 加 密 Cookie 进行 控制 。 


我 在 处 理 某 个 用 户 无 法 登录 的 缺陷 一 一 看 来 在 某 些 情况 下 ， 生 成 Cookie 的 代码 出 
错 了 。 一 旦 我 找 出 哪里 出 错 ， 修 复 就 是 很 容易 的 事 了 ， 于 是 又 解决 了 一 个 缺陷 。 


但 我 有 一 种 挥 之 不 去 的 疑问 。 造 成 错误 Cookie 的 环境 十 分 普通 ， 可 为 什么 只 有 一 
个 用 户 有 问题 ? 其 他 人 如 何 就 能 够 登录 成 功 了 ? 一 定 还 有 问题 。 


果然 ,深入 调查 表明 ， 该 系统 并 非 我 们 想象 的 那么 安全 。 它 应 该 是 更 换 密码 定期 加 
密 Cookie, 但 这 并 没有 完全 做 到 。 那 些 遇 到 这 个 缺陷 的 用 户 并 没有 这 样 做 ， 因 为 他 们 还 
能 继续 使 用 旧 的 Cookie。 


如 果 我 没有 听 到 内 心中 有 个 小 小 的 声音 说 “还 有 点 儿 不 对 劲 ， 你 还 没 搞 清 楚 " ， 那 
么 我 们 就 永远 不 会 发 现 这 一 点 。 


肯特 “贝克 在 《测试 驱动 开发 》[Bec02] 中 谈 到 了 类 似 的 效果 。 有 时 ， 我 们 写 一 个 期 待 失败 
的 测试 ， 但 实际 上 它 却 通 过 了 。 当 发 生 这 种 情况 时 ， 肯 定 有 些 东 西 是 值得 我 们 深入 思考 的 。 


但 是 这 六 个 步骤 中 肯定 也 遗漏 了 一 些 东 西 。 应 该 有 第 七 个 步骤 :“ 它 永远 不 会 再 发 生 了 1” 在 
接 下 来 的 章节 中 ， 我 们 将 看 看 你 能 做 些 什么 以 确保 它 永远 不 会 再 发 生 了 。 


5.2 ”哪里 出 了 问题 
从 缺陷 中 吸取 教训 的 第 一 步 就 是 要 确定 到 底 是 哪里 出 了 问题 。 


五 个 为 什么 
对 缺陷 发 生 的 根本 原因 进行 分 析 的 一 个 有 效 手 段 就 是 问 五 次 “为 什么 ”"， 比 如 : 


口 软件 崩 汪 了， 为 什么 ? 
口 该 代码 不 处 理 数据 传输 过 程 中 的 网 络 故 障 ， 为 什么 ? 
o 没有 专门 检测 网 络 故障 的 单元 测试 ， 为 什么 
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口 最 初 的 开发 人 员 并 没 意 识 到 应 该 创建 一 个 这 样 的 测试 ， 为 什么 ? 
口 我 们 的 单元 测试 并 没有 考虑 到 网 络 故 障 ， 为 什么 ? 
口 我 们 在 原先 设计 中 没有 考虑 网 络 故障 。 


为 什么 是 五 次 “为 什么 ” 呢 ? 这 只 是 一 个 经 验 法 则 一 一 有 时 你 需要 的 步骤 很 少 ， 有 时 则 
很 多 。 有 时 这 也 无 济 于 事 ( 它 仅 帮 你 识别 已 经 知道 的 问题 症结 ) 。 但 总 的 来 说 它 很 有 帮助 ， 
因为 “五 次 ”似乎 在 大 多 数 情况 下 都 适用 。 





5.2.1 ”我们 已 经 做 到 了 吗 


是 不 是 确定 了 哪里 出 了 问题 就 是 诊断 要 做 的 所 有 工作 ? 是 的 , 但 我 们 这 里 所 探讨 的 涉及 面 更 
广 一 一 软件 最 开始 是 如 何 产生 这 个 错误 的 呢 ? 

例如 , 你 做 出 的 诊断 是 , 没 想到 接收 服务 器 的 数据 时 会 产生 网 络 中 断 , 因而 造成 了 这 个 缺陷 。 
这 是 需要 你 诊断 的 时 候 要 尽 可 能 考虑 清楚 的 问题 。 我 们 现在 是 要 弄 清楚 为 什么 代码 的 开发 人 员 一 
开始 没有 意识 到 他 们 必须 处 理 网 络 故障 。 


5.2.2 根本 原因 分 析 


如 果 起 初 开 发 的 代码 中 隐匿 着 缺陷 , 说 明 在 你 的 开发 过 程 中 一 定 出 现 了 什么 问题 。 到底 是 在 
什么 时 候 呢 ?又 是 为 什么 呢 ? 


责备 

前 脆性 地 找 出 工作 过 程 中 出 现 的 问题 对 总 体质 量 的 提高 是 非常 有 帮助 的 。 要 注意 ,目标 
是 汲取 经 验 教 训 ， 不 要 责备 任何 人 。 

是 的 ， 某 人 在 某 些 地 方 可 能 搞 砸 了 ， 但 我 们 都 会 偶尔 犯 一 些 错误 。 责备 别人 没有 用 。 

责备 文化 具有 腐蚀 性 ， 它 会 破坏 成 功 最 关键 的 因素 一 一 团队 精神 。 如 果 人 们 担心 会 因为 
犯错 误 而 被 嘲笑 或 受到 惩罚 ,那么 ， 同 事 就 会 担心 如 何 保护 自己 ， 而 不 去 关心 怎样 尽力 地 为 


了 他 的 团队 或 组 织 工 作 。 在 最 坏 的 情况 下 ， 这 其 至 会 导致 说 说 ， 涉 及 无 阐 的 人 ， 并 导致 其 他 
不 正常 的 行为 。 

榜样 的 力量 是 无 穷 的 ,无 论 是 好 榜样 还 是 坏 榜样 。 如 果 当 你 跟踪 到 一 个 特别 棘手 的 问题 
后 ， 就 向 主要 责任 人 大 声 吃 哮 ,那么 团队 的 其 他 成 员 也 会 效仿 。 相 反 地 ， 如 果 你 自己 造成 的 
问题 出 现 了 , 坦白 并 主动 承认 自己 的 过 失 ，, 会 告诉 大 家 这 没有 什么 好 羞耻 的 。 当 问题 出 现时 ， 
你 的 处 理 方式 比 这 个 问题 本 身 更 加 重要 。 
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需求 ”这 些 需 求 是 否 完整 且 正 确 ? 它 是 模糊 不 清 的 、 未 被 正确 理解 或 遭 到 误解 了 吗 ? 


架构 或 设计 有 没有 在 架构 或 设计 中 存在 什么 疏漏 一 一 可 能 是 我 们 没有 考虑 到 一 些 事情 吧 ? 
或 者 设计 没有 问题 ， 但 是 我 们 没有 正确 地 按照 设计 来 做 ? 


测试 ”我 们 对 代码 的 测试 是 否 达到 了 足够 的 覆盖 率 ? 或 者 可 能 测试 本 身 就 有 缺陷 呢 ? 

构造 ” 当 你 解决 一 个 缺陷 时 这 是 最 常 想到 的 。 或 许 开 发 人 员 在 写 代码 时 犯 了 一 个 很 简单 的 错 
误 ， 或 许 他 们 误解 了 某 些 基础 技术 ( 库 文件 、 编 译 器 等 )。 
53 ” 它 不 会 再 发 生 了 


- 旦 你 确定 了 错误 的 来 源 ,就 可 以 采取 措施 避免 它 再 发 生 。 在 某 些 情况 下 ,这 只 不 过 是 告诫 
自己 将 来 在 这 一 方面 要 更 加 小 心 , 或 者 委婉 地 让 你 的 同事 认识 到 自己 的 错误 在 有 些 情况 下 ,你 








在 事后 反思 时 要 加 以 总 结 一 一 尤其 是 你 发 现 了 错误 的 模式 发 生 在 特定 的 点 或 特定 的 原因 下 ; 极 少 
数 情况 下 ， 可 能 需要 给 自己 “项 响 警 钟 ”。 
5.3.1 自动 验证 


我 们 应 该 关注 那些 出 现 问 题 的 区 域 、 常 见 的 错误 和 同一 问题 的 其 他 例子 。 假设 你 刚刚 修复 了 
会 产生 内 存 泄 露 的 C++ 代码 ， 如 下 : 


void f(void) 


{ 
Ts pt = new T; 


«Do something with pt» 


delete pt; 
} 


除非 它 调用 的 一 个 函数 抛 出 异常 ， 否 则 这 组 代码 是 不 错 的 。 在 这 种 情况 下 ，pt 不 会 被 删除 。 
这 个 问题 有 多 种 方法 来 解决 ， 例 如 通过 使 用 标准 库 中 的 auto_ptr 〇 方法 ， 如 下 : 
void f(void) 
auto_ptr<T> pt(new T); 
«Do something with pt» 


// auto_ptr ensures that pt is deleted even if an exception is thrown 


} 
很 好 ， 另 一 个 缺陷 油 然而 生 。 但 在 我 们 继续 之 前 ， 应 该 考虑 原来 的 缺陷 是 否 是 一 次 性 的 。 至 
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少 看 起 来 很 有 可 能 原来 代码 的 作者 不 知道 如 何 编写 异常 安全 的 C++ 代码 。 在 这 种 情况 下 , 是 否 会 
有 相同 问题 在 其 他 地 方 出 现 呢 ? 现在 是 该 做 审查 的 时 候 了 , 看 看 是 否 还 有 与 该 问题 类 似 的 其 他 例 
子 ， 发 现 并 解决 它们 ， 而 不 是 等 那些 可 能 潜伏 的 缺陷 被 发 现时 才 采 取 措 施 。 


和 同事 交流 


让 同事 知道 他 们 犯 了 错误 可 能 是 一 件 很 危险 的 事 。 一 方面 ,这 是 非常 有 价值 的 信息 ， 你 
| 有 责任 让 他 们 知道 ， 使 他 们 能 在 未 来 避免 重 蹈 敌国 。 另 一 方面 ， 我 们 程序 员 并 不 普 于 人 际 沟 
| 通 ， 如 果 你 冒 冒 失 失 口 无 这 拦 地 说 某 个 人 把 事情 搞 砸 了， 会 很 容易 出 现 问 题 。 


没有 什么 固定 的 技巧 捷径 。 有 时 候 ， 不 管 你 是 多 么 小 心 ， 你 的 善意 得 到 的 可 能 却 是 不 友 
好 的 回应 。 但 你 还 是 可 以 主动 做 些 有 益 的 事情 。 


口 最 重要 的 是 , 要 有 正确 的 出 发 点 。 如 果 你 告诉 他 们 犯 了 错误 ,只 是 为 了 自己 得 到 优越 
感 ， 那 还 是 免 开 苯 口 吧 。 无 论 那些 反馈 信息 说 起 来 显得 多 么 有 帮助 ， 你 的 真实 动机 迟 
早 会 昭然 天 下 的 。 

O 在 进行 交流 之 前 要 三 思 。 设身处地 地 想象 一 下 面 对 同 样 情形 时 自己 会 是 什么 反应 ,并 
且 还 要 清楚 地 知道 每 个 人 的 性 格 都 不 一 样 。 

口 避 免 亡 作 评价 。 可 以 说 “我 /我 们 怎样 怎样 "， 而 不 说 "你 怎么 怎么 "。 

口 要 有 建设 性 。 

O 记 住 , 你 也 可 能 说 错 了 。 不 要 简单 地 宣布 ,他 们 犯 了 一 个 错误 , 要 尽 可 能 地 与 他 们 探 
讨 。 你 可 能 会 发 现 ， 他 们 的 行为 有 十 足 的 理由 ， 也 许 那 不 是 他 们 的 错 ， 甚 至 是 你 自己 
误 判 了 问题 。 





更 好 的 情况 是 , 你 能 找到 一 -种 方法 来 自动 检测 这 种 类 型 的 错误 , 使 我 们 避免 以 后 发 生 类 似 的 
问题 吗 ? 在 10.3 节 中 ， 我 们 将 讨论 一 种 自动 检测 这 类 问题 的 枝 术 。 而 事实 证 明 ， 我 们 可 以 针对 
共 他 各 种 各 样 的 错误 都 这 么 做 。 


不 论 大 小 ， 多 数 项 目的 特有 问题 会 越 积 越 多 。 如 “创建 新 客户 前 要 确保 先 更 新 账户 表 ” 之 类 
的 问题 。 只 要 有 这 类 问题 存在 ， 就 会 有 人 出 错 。 而且， 除非 你 碰巧 知道 有 这 个 问题 。 否 则 就 不 知 
该 如 何 回避 。 第 10 章 会 介绍 如 何 创建 不 知情 情况 下 能 够 自动 给 出 提示 的 自 调试 软件 。 


5.3.2 Æ 


另外 要 考虑 的 是 ,代码 是 否 会 使 人 误 入 歧途 。 如 果 你 发 现 某 一 特定 问题 的 几 个 例子 ,是 不 是 
因为 结构 或 接口 方面 的 原因 使 人 们 很 容易 反复 犯 同样 的 错误 呢 ? 
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例如 ， 你 注意 到 人 们 往往 会 传递 错误 的 参数 到 下 面 的 C 函数 中 : 


void drawRectangle(int x, int y, int width, int height, 
bool border, bool fill, bool client_coordinates) ; 


如 果 你 想 一 下 典型 的 调用 可 能 是 什么 样子 的 ， 就 能 明白 为 什么 人 们 在 为 正确 的 参数 苦 苦 挣扎 。 例 
如 : 

drawRectangle(10, 10, 30, 50, true, true, false); 
这 很 难 自圆其说 。 但 改变 以 下 一 些 代 码 的 定义 ; 


const int NO_BORDER = 0x00; 

const int DRAW_BORDER = 0x01; 

const int NO_FILL = 0x00; 

const int FILL_BODY = 0x02; 

const int GLOBAL_COORDINATES = 0x00; 
const int CLIENT COORDINATES = 0x04; 


void drawRectangle(int x, int y, int width, int height, 
unsigned int options); 


这 又 意味 着 现在 可 以 采用 如 下 方式 进行 调用 。 


drawRectangle(10，10，30，50， 
DRAW_BORDER | FILL_BODY | GLOBAL_COORDINATES) ; 


这 样 代码 就 清晰 多 了 (更 不 容易 出 错 )。" 
5.3.3 过程 


我 们 刚刚 看 到 的 这 些 技术 的 优点 就 是 它们 十 分 明确 。 改进 后 的 接口 排除 了 错误 用 法 ， 能 有 效 
避免 再 次 犯 同样 的 错误 。 自 动 化 的 检查 总 是 会 及 时 发 现 问题 所 在 。 所 以 ， 如 果 你 能 使 用 这 种 方法 
从 根本 上 解决 问题 ， 那 么 当然 应 该 这 样 做 。 


不 幸 的 是 ， 并非 总 是 能 够 找到 一 各 方法 来 完全 消除 错误 , 检查 你 的 工作 过 程 可 能 是 你 唯一 的 
选择 。 

也 许 你 需要 看 看 你 的 需求 文档 的 质量 是 不 是 过 关 ? 或 者 考虑 引入 设计 审查 ?也 许 在 代码 审 
查 时 对 照常 见 陷阱 的 检查 列表 会 有 作用 ? 


5.4 关闭 循环 
你 正在 着 手 的 项 目 会 有 自己 的 一 套 规范 : 


D 如 果 你 足够 幸运 ， 使 用 支持 命名 参数 的 语言 在 工作 ， 那 就 不 必 这 么 绕 圈 子 。 
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O 编码 规范 
口 测试 规范 
o 文档 规范 
o 报告 /跟踪 过 程 
O 设计 指南 
O 性 能 需求 


无 论 你 何 时 修复 一 个 缺陷 , 你 都 需要 牢 牢记 住 它们 。 你 是 否 需 要 把 更 新 最 终 用 户 文档 作为 修 
复 的 结果 ? 或 为 下 一 个 版 本 更 改 日 志 ? 工作 是 否 需要 针对 特定 客户 或 项 目 进行 跟踪 ? 你 需要 添 
加 一 条 记录 在 你 的 错误 跟踪 包 中 吗 ? 或 者 把 它 交 给 QA 部 门 〈 他 们 需要 哪些 支持 材料 ) ? 


好 ， 就 介绍 这 么 多 了 。 我 们 已 经 谈 了 缺陷 的 来 龙 去 脉 : 复制 、 诊 断 、 修 复 、 反 思 。 下 一 部 分 
将 从 大 局 看 调试 ， 介 绍 如 何 发 现代 码 存在 问题 ， 以 及 如 何 把 缺陷 修复 与 软件 开发 相 结合 。 


5.5 ” 付 诸 行动 


花 时 间 来 进行 根本 原因 分 析 。 
在 过 程 的 哪个 点 上 产生 了 错误 ? 
出 什么 错 了 ? 
o 确保 同样 的 问题 不 会 再 发 生 。 
a 自动 检查 是 否 存在 问题 。 
重 构 代码 以 避免 不 当 使 用 。 
a 和 同事 交谈 ， 适 当 修改 进程 。 
o 多 方 反 馈 ， 与 其 他 利益 相关 者 形成 闭环 。 





从 大 局 看 调试 





第 6 章 发 现代 码 存在 问题 
第 7 章 务实 的 零 容 忍 策略 


第 0 章 
发 现代 码 存在 问题 


在 本 书 的 第 一 部 分 ， 我 们 一 开始 就 假定 已 经 知道 软件 存在 缺陷 了 。 在 这 一 章 中 , 我们 要 看 看 
在 此 之 前 还 要 做 什么 。 


缺陷 可 以 随时 出 现在 软件 开发 生命 周期 中 的 任何 一 个 阶段 一 一 从 代码 编写 完毕 到 代码 发 布 
后 的 经 年 累 月 。 理 想 情况 下 ， 你 会 自己 尽早 发 现 这 些 缺 陷 一 - 越 早 发 现 就 越 容易 修复 ,而 且 和 避免 
以 后 让 用 户 揪 住 把 柄 。 


AM, 很 多 情况 下 ,尽管 我 们 已 经 尽 了 最 大 努力 , 但 是 客户 还 是 遭受 缺陷 的 侵扰 。 在 这 一 章 
中 ， 我 们 会 讨论 过 到 问题 后 将 要 做 些 什 么 。 具 体 来 说 ， 我 们 将 介绍 以 下 内 容 : 

口 缺陷 追踪 ， 

a 与 用 户 合作 ; 

口 与 客户 支持 和 QA 部 门 合作 。 


6.1 追踪 缺陷 


无 论 你 在 开发 什么 样 的 软件 , 都 需要 创建 -- 些 流程 ,通过 这 些 流程 用 户 可 以 告诉 你 软件 出 现 
了 哪些 问题 (最终 ， 通 过 这 些 流程 你 可 以 告诉 用 户 如 何 修复 )。 


6.1.1 缺陷 追踪 系统 


缺陷 追踪 系统 的 规模 、 范 围 和 使 用 方法 各 有 千秋 。 有 些 是 简单 的 单 用 途 系统 ， 有 些 则 是 功能 
全 面 的 工作 流程 管理 系统 一 一 用 来 控制 和 记录 软件 开发 过 程 的 方方面面 (缺陷 追踪 只 是 其 中 的 -- 
小 部 分 )。 然 而 ， 这 些 缺 陷 追 踪 系 统 的 基本 目标 都 是 相同 的 。 


口 首要 的 一 点 ， 它 能 确保 我 们 不 会 遗漏 缺陷 。 
口 通过 提供 一 个 缺陷 报告 的 标准 格式 ， 可 以 大 大 增加 把 所 有 相关 信息 都 包含 其 中 的 机 会 。 
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O 作为 审查 线索 ， 缺 陷 追 踪 系 统 可 以 确保 我 们 知道 每 一 个 版 本 中 哪些 缺陷 还 未 解决 ， 哪 些 
缺陷 已 经 被 修复 了 , 被 谁 、 如 何 修复 的 。 它 可 以 作为 软件 发 布 的 重要 信息 来 源 (我 们 甚至 
可 以 自动 生成 它们 )。 

口 让 我 们 设 定 缺陷 的 优先 级 ， 并 确定 先 解 决 哪个 缺陷 。 

口 通过 为 各 利益 相关 方 提供 一 种 互相 沟通 的 方法 ， 它 可 以 确保 每 个 人 都 能 了 解 缺 陷 的 当前 
状态 ， 还 能 确保 职责 在 团队 之 间 传 递 时 准确 提供 了 所 有 相关 信息 。 

O 作为 一 种 管理 工具 ， 它 提供 了 该 项 目的 当前 状态 概况 。 

O 极 少 数 情况 下 ， 我 们 也 会 选择 不 修复 某 个 缺陷 ， 在 作出 决策 后 我 们 可 以 把 这 样 做 的 原因 
记录 在 缺陷 追踪 系统 里 ， 这 样 将 来 就 不 必 再 重复 这 一 过 程 。 


无 论 你 的 缺陷 追踪 系统 多 么 好 ， 它 的 作用 还 是 取决 于 它 提 供 的 信息 。 


6.1.2 怎样 才能 写 出 一 份 出 色 的 缺陷 报告 


我 们 都 有 这 样 令 人 诅 开 的 经 历 : 不 得 不 面 对 一 个 不 能 提供 任何 帮助 的 缺陷 报告 。 报 告 中 除了 
“软件 出 现 问题 了 ”之 外 ， 就 没有 任何 有 用 的 信息 ， 也 没有 告诉 你 下 一 步 该 怎么 做 。 所 以 ， 我 们 
知道 我 们 不 需要 什么 样 的 缺陷 报告 。 然 而 ,在 理想 情况 下 我 们 应 该 从 缺陷 报告 中 得 到 什么 样 的 信 
息 呢 ? 

乍 一 看 ， 这 是 显而易见 的 一 所 有 可 以 帮助 我 们 诊断 问题 的 信息 都 是 必要 的 。 遗 憾 的 是 ， 在 
我 们 未 完成 诊断 这 个 过 程 之 前 ， 我 们 无 法 知道 哪些 信息 是 相关 的 ， 哪 些 信息 是 无 关 的 。 因 此 ,一 
份 好 的 缺陷 报告 包含 的 信息 宁 多 毋 少 。 


W 小 乔 爱问 
过、 我 需要 采用 电子 方式 跟踪 缺陷 吗 

国 为 我 们 每 天 都 要 与 缺陷 打交道 ， 自 然 就 认为 所 有 的 问题 都 应 该 使 用 技术 手段 来 解决 。 
但 是 有 时 候 ， 这 么 做 却 会 很 三 事 。 


如 果 你 在 一 个 小 的 团队 中 工作 , 没有 太 多 的 缺陷 要 跟踪 ， 不 需要 提供 远程 访问 你 的 缺陷 
数据 库 的 方法 ， 那 么 一 种 非 技术 解决 方案 (把 索引 卡 贴 在 一 个 白板 上 ? ) 很 可 能 更 适合 你 。 


但 是 ,不 要 把 那些 技术 含量 低 的 系统 不 当 回 事 。 负 责任 地 处 理 缺 陷 是 专业 软件 开发 很 重 
要 的 一 部 分 ， 不 要 因为 缺陷 报告 是 手写 的 就 不 认真 对 待 。 
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REERLAGO,. RA 它 应 该 是 具体 的 、 明 确 的 和 详细 的 。 如 果 要 显示 错误 


aration, 信息 ， 应 该 如 何 准确 地 描述 呢 ? 如 果 数 据 被 破坏 了 ， 该 如 
A report should be specific, PIVE? 如 何 准确 地 找 出 导致 问题 发 生 的 行为 呢 ? 如 果 输 
unambiguous, and detailed... 出 是 不 正确 的 ， 那 么 是 以 什么 样 方式 输出 的 呢 ? 如 果 有 相 


应 的 支持 资源 (如 导致 问题 重 现 的 输入 文件 ， 不 正确 的 输 
出 画面 ， 等 等 )， 这 些 都 应 该 记录 在 缺陷 报告 中 。 


—RESERLEDR UD. 与 之 前 说 的 宁 多 毋 少 相对 应 ， 缺 陷 报 告 的 内 容 同 时 也 
唯一 前 。 应 最 小 化 。 如 果 要 使 用 一 个 有 10 000 行 的 输入 文件 来 重 现 

.but also minimal and 问题 ,那么 这 个 文件 到 底 可 不 可 以 被 前 减 ? 导致 缺陷 发 生 
unique. 的 一 系列 行为 中 哪些 是 关键 的 ， 哪 些 是 可 以 忽略 的 ?如 果 





在 软件 一 个 版 本 中 出 现 了 缺陷 ， 那 么 是 否 有 还 没有 出 现 问 题 的 其 他 版 本 呢 ? 


与 此 相关 的 , 缺陷 报告 也 应 该 是 独特 的 。 如 果 问 题 已 经 报告 了 ,再 次 报告 是 不 太 可 能 有 帮助 
的 〈 尽 管 可 能 会 有 额外 的 信息 添加 到 现 有 的 报告 中 ) 。 


我 最 喜欢 的 缺陷 报告 


我 开发 的 产品 有 一 个 能 够 捕获 所 有 异常 的 处 理 器 , 当 事 情 无 法 挽回 时 , 它 会 显示 “ 屏 
幕 崩溃 " 。 谢 天 谢 地 ， 这 种 事 不 是 经 常 发 生 ， 但 是 当 我 们 追查 原因 时 它 可 以 极 大 地 帮助 
我 们 。 


之 后 我 们 收 到 一 份 缺陷 报告 ， 上 面 写 着 : “崩溃 屏幕 没有 取消 功能 。 


你 必须 把 报告 交 给 提交 报告 的 用 户 ， 如 果 我 们 能 够 实现 它 ， 这 个 “取消 ”无 疑 将 是 
一 个 伟大 的 功能 ! 


6.1.3 ”环境 和 配置 报告 

几乎 每 一 个 缺陷 跟踪 系统 都 有 其 环境 域 。 如 果 你 在 桌面 软件 上 工作 , 缺陷 跟踪 系统 可 能 会 被 
用 来 记录 出 现 缺陷 的 操作 系统 ， 对 于 Web 应 用 来 说 记录 的 就 是 浏览 器 。 

听 着 不 错 。 这 就 够 了 吗 ? 


有 两 方面 的 原因 说 明 这 是 不 够 的 。 首 先 ,大 部 分 非 技术 用 户 通常 不 知道 他 们 的 应 用 环境 。 你 
妈妈 知道 她 用 哪 种 浏览 器 吗 ? 你 销售 部 门 的 同事 知道 他 们 已 经 安装 了 哪些 Windows 服务 包 吗 ? 
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其 次 ， 也 是 更 为 重要 的 ， 计 算 环 境 正 在 变 得 越 来 越 复杂 ， 且 无 时 无 刻 不 在 互相 关联 。 了 解 用 
户 使 用 Firefox 浏览 器 访问 你 的 网 站 就 够 了 吗 ? 几乎 可 以 肯定 这 是 不 够 的 ， 你 可 能 还 需要 确切 知 
道 他 使 用 的 Firefox 是 哪个 版 本 的 ， 浏 览 器 在 什么 平台 上 使 用 ， 已 经 安装 了 哪些 插件 ， 他 们 是 否 
启用 了 Cookie 和 JavaScript 等 。 


你 可 以 通过 为 软件 增加 一 个 选项 来 记录 任何 一 个 影 i 
响 其 行为 的 环境 因素 来 解决 这 个 难题 。 当 然 ， 对 于 许多 缺 Collect environment and 
陷 而 言 ,大 多 数 的 甚至 全 部 的 信息 都 是 无 关 紧 要 的 , 但 是 configuration information automa- 
如 果 自 动 记录 ,我 们 就 可 以 不 费力 气 得 到 这 些 信息 , 也 可 _tically. 

以 相信 其 准确 性 。 当 这 些 信息 有 用 的 时 候 ， 它 们 就 是 无 价 

Z$. 





你 能 再 说 一 遍 吗 
感觉 是 在 赎罪 (有 时 感觉 像 炼狱 ) ， 在 我 职业 生涯 的 很 长 一 段 时 间 里 为 移动 电话 开 
发 软件 。 如 果 你 认为 用 户 不 知道 笔记 本 上 运行 着 什么 ， 那 你 应 该 问 问 他 们 手机 上 都 装 了 
什么 。 
冷 不 防 地 问 一 下 (不 要 看 )， 你 的 手机 是 什么 牌子 ? 什么 机 型 ? 你 不 能 确定 吗 ? 
现在 就 看 一 看 吧 ， 你 可 能 仍然 弄 不 清楚 。 在 你 搞 不 清 状 况 的 时 候 你 该 怎样 找到 答案 
呢 ? 
现在 , 想象 一 下 当 客户 甚至 回答 不 出 他 们 使 用 的 硬件 的 最 基本 问题 时 ,你 该 如 何 做 
技术 支持 工作 呢 ?% “ 咽 一 一 它 是 一 个 银 黑 色 的 按钮 。 您 听 明 白 了 吗 ?" 
同样 的 论点 适用 于 你 的 软件 支持 的 任何 配置 选项 。 如 果 你 提供 了 一 种 可 以 自动 记录 的 方法 ， 
类 似 于 “你 确定 你 开启 了 功能 X” 这 样 的 问题 就 不 会 再 出 现 了 。 

这 类 报告 的 一 个 很 好 例子 是 : 被 很 多 Web 浏览 器 支持 的 各 种 不 同 的 about:URLs 配置 。 试 着 
对 Firefox 配置 about:config (图 6-1), about:buildconfig 或 者 about:cache， 你 就 知道 我 的 
意思 了 。 
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BOG about:config =) 





accessibility accesskaycattcenbctivation defauit boolean true ® 
accessibility.blockautorefresh default boolean false 
accessibility.browsewithcaret . default boolean false 
accessibility.tabfocus_applies_to_xul default boolean true f 
accessibility.typeaheadfind default boolean false f 
accessibility.typeaheadfind.autostart default boolean true f 
accessibility.typeaheadfind.casesensitive defauit integer 0 
accessibility.typeaheadfind.enablesound default boolean true 
accessibility.typeaheadfind.enabletimeout default boolean true 
accessibility.typeaheadfind.flashBar userset integer © 
accessibility.cypeaheadfind.linksonly default boolean false f 
accessibility.typeaheadfind.prefilliwithselection default boolean true | 
accessibility.typeaheadfind.soundURL default string beep | 
accessibility.typeaheadfind. startlinksonly default boolean false f 
accessibility.typeaheadfind.timeout defauit integer 5000 | 
accessibility.usebrailledisplay default string f 
accessibility.usetexttospeech defauit string f 
accessibility.warn_on_browsewithcaret default boolean true f 
advanced.mailftp default boolean false | 
alerts.slideincrement default integer 1 | 
alerts.slideincrementTime default Integer 10 
alerts.totalOpenTime default integer 4000 e 
app.releaseNotesURL default string http: / LOCALE. www. mozilia.com /*LOCALE%/%. a 
r 


app.: Rod baseURL default string http: //support.mozilla.com/ 1 /%APPX/%VERSIONS. 





6-1 Firefox fj ABOUT: CONFIG 页 


6.2 与 用 户 合作 


作为 一 个 软件 工程 师 , 你 了 解 缺 陷 报告 的 价值 。 如 果 没 有 人 花 时 间 和 精力 向 你 反映 问题 ,你 
就 不 能 找 出 这 些 缺 陷 ， 也 就 不 会 修复 这 些 你 所 不 知道 的 缺陷 。 


6.2.1 简化 流程 


不 幸 的 是 , 没有 什么 可 以 保证 用 户 能 花 时 间 来 报告 缺陷 , 即使 报告 了 也 不 能 保证 他 们 高 质量 
地 报告 这 些 缺 陷 。 但 是 你 可 以 尽 可 能 多 地 消除 不 利 条 件 来 提高 缺陷 报告 的 质量 。 

明确 说 明 如 何 报告 一 个 缺陷 ”在 软件 的 “About” 对 话 框 中 、 在 线 帮助 中 及 网 站 上 和 其 他 任 
何 你 认为 合适 的 地 方 写 上 一 些 说 明 (或 者 最 好 直接 使 用 链接 ) 来 解释 如 何 报告 缺陷 。 


自动 化 ”安装 一 个 顶层 的 异常 处 理 程序 ， 给 用 户 发 送 缺 陷 报告 的 选项 ， 报 告 中 可 以 自动 包 
含 所 有 相关 细节 。 
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提供 多 种 选择 ”有些 人 可 能 喜欢 使 用 电子 化 的 方式 报告 缺陷 ， 而 其 他 人 可 能 喜欢 通过 与 人 
交谈 来 说 明 缺 陷 。 有 些 人 可 能 喜欢 电子 邮件 的 方式 ， 而 其 他 人 可 能 喜欢 在 线 表单 的 方式 。 


要 尽量 简单 ”你 要 求 用 户 执行 的 动作 每 多 一 次 ， 能 够 完成 任务 的 人 数 就 会 减少 一 半 。 换 句 
话说 ， 要 求 他 们 点 击 3 次 的 话 ， 就 只 有 12.5% 的 用 户 能 够 完成 。 点 击 五 次 的 话 ， 这 个 数字 会 减少 
到 3% 多 一 点 。 

模板 不 要 太 死 板 ”为 缺陷 报告 做 一 个 标准 模板 是 个 好 主意 。 但 要 注意 不 要 使 该 模板 太 死 板 ， 
请 确保 你 为 每 个 域 设 置 合理 的 选项 ， 包 括 “ 以 上 都 不 是 ”。 


尊重 用 户 的 隐私 ”你 的 用 户 的 数据 属于 他 们 自己 ， 而 不 属于 你 。 你 要 清楚 地 了 解 这 一 点 ， 
并 遵守 相关 的 隐私 策略 。 


你 会 这 样 想 , 不 是 吗 ? 毕竟 ,他们 在 使 用 这 个 软件 ， 因 为 他 们 要 用 它 完 成 一 些 事情 ， 而 
缺陷 妨碍 了 他 们 。 


但 是 , 不管 你 怎么 想 , 大 多 数 用 户 在 软件 出 错时 是 不 会 来 找 你 的 。 有 些 人 会 认为 这 是 他 


们 自己 的 错 一 一 他 们 “点 错 了 按钮 "。 有 些 人 会 无 可 奈何 地 叹息 (KA), 重新 启动 软 
件 ， 继 续 自己 的 工作 。 还 有 一 些 人 会 十 分 费劲 地 试图 找到 一 个 缺陷 的 解决 办 法 ,而 你 可 能 在 
几 秒 钟 内 就 能 搞定 。 


作为 一 个 经 验 法 则 ， 对 于 每 一 个 向 你 报告 问题 的 用 户 ， 将 对 应 有 10 至 100 个 用 户 经 历 
过 同样 的 问题 ， 却 没 想到 联系 你 。 





6.2.2 有效 的 沟通 


与 客户 交流 可 能 会 非常 环 手 。 有 效 的 沟通 需要 双方 共享 信息 , 但 你 的 观点 一 定 是 不 同 于 你 的 
客户 的 。 他 们 不 能 像 你 一 样 深 刻 理解 程序 代码 , 而 你 可 能 不 会 理解 他 们 所 从 事 领域 的 问题 。 你 们 
使 用 不 同 的 词汇 ， 具 有 不 同 的 技能 ， 并 运用 不 同 的 办 法 解决 问题 。 你 必须 意识 到 这 些 差 异 以 及 这 
些 差 异 可 能 引发 的 问题 。 

没有 什么 简单 的 办 法 能 够 解决 这 些 沟 通 方 面 的 问题 .所 有 你 能 做 的 就 是 要 明白 这 些 问 题 是 不 
可 避免 的 ， 并 且 保 持 冷静 ， 去 解决 这 些 问 题 。 
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1. 心智 模式 


我 们 通过 创建 特定 的 心智 模式 来 应 对 这 个 世界 。 作 为 软件 工程 师 , 我 们 尤其 知道 这 一 点 一 一 
软件 是 这 些 模式 的 具体 化 。 


~ ARP BRRR- TA 你 的 客户 也 拥有 他 们 自己 的 心智 模式 。 你 可 能 会 惊讶 
RIMS, 地 发 现 ， 和 他 们 的 心智 模式 与 你 的 有 多 么 地 不 同 。 
Imagine how things might appear 


当 你 认为 你 们 是 基于 同一 个 模型 而 工作 时 就 会 产生 
风险 。 这 会 导致 无 数 的 误解 ， 需 要 大 量 工作 才能 消除 。 


最 有 效 的 解决 方法 是 换 位 思考 ,从 用 户 的 角度 设想 一 下 会 发 生 什么 。 你 的 目标 是 将 他 们 的 观 
察 结果 〈 你 可 以 信任 的 ) 与 他 们 的 解读 〈 这 些 解读 会 带 上 他 们 的 心智 模式 的 色彩 ) 分 开 。 
我 知道 问题 所 在 了 
马 库 斯 格 罗 伯 尔 
我 用 语音 合成 技术 为 言 人 开发 手机 软件 ， 有 时 听 他 们 说 :“ 我 的 电话 在 做 某 事 的 时 


候 挂 断 了 。” 但 我 知道 他 要 表达 的 真正 意思 是 :“ 在 我 做 某 事 的 时 候 音 频 输 出 中 断 了 。" 
对 盲人 用 户 来 说 挂 断 与 听 不 到 声音 是 没有 区 别 的 。 


2. 和 非 技术 人 员 沟 通 


除非 你 在 极 个 别 的 情况 下 为 其 他 的 程序 员 开 发 软件 〈 这 时 你 或 许 会 遇 到 稍稍 不 同 的 沟通 问 
题 ， 但 同样 具有 挑战 性 ) ， 否 则 你 的 用 户 可 能 并 不 了 解 所 用 的 技术 。 他 们 可 能 不 明白 你 认为 理 所 
当然 的 事情 ， 也 体会 不 到 你 在 诊断 一 个 问题 时 所 涉及 的 微妙 的 细节 。 


最 大 的 问题 通常 是 抽取 正确 的 细节 问题 。 最 不 起 眼 的 细节 可 能 就 是 最 最 关键 的 地 方 ， 但 是 你 
的 用 户 可 能 不 会 意识 到 这 有 多 关键 。 他 们 极 有 可 能 会 引用 错误 的 信息 , 而 不 是 准确 地 描述 缺陷 或 
者 剔除 一 些 “ 无 关 ” 的 细节 。 当 你 更 深入 挖掘 一 些 细节 时 ， 他 们 可 能 也 无 法 很 好 地 响应 你 。 

唯一 的 解决 办 法 是 要 有 桓 心 ,解释 一 下 为 什么 这 些 细节 很 重要 ,并 通过 必要 的 步骤 说 服 他 们 ] 
来 收集 所 需要 的 有 关 数 据 。 这 可 能 是 令 人 诅 形 的 ,你 在 几 秘 钟 内 能 解决 的 事情 却 可 能 需要 他 们 很 
长 的 时 间 ， 但 是 你 付出 的 时 间 绝 对 是 值得 的 。 


From your user’s perspective. 


你 交谈 的 对 象 有 多 专业 
Fw: SE 


通过 电子 邮件 或 电话 判断 一 个 人 有 多 精通 于 技术 是 特别 难 的 。 当 我 们 和 用 户 交谈 时 
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这 是 一 个 要 处 理 的 问题 。 如 果 他 们 精通 计算 机 操作 ， 而 你 告诉 他 们 说 “找到 蓝 色 的 图 标 
E” 来 启动 卫 浏览 器 ， 就 会 使 他 们 非常 恼火 ， 但 是 同样 令 人 吃惊 的 是 ， 我 们 最 后 还 是 不 
得 不 总 用 这 类 语言 与 用 户 交谈 。 

我 曾经 对 一 个 开发 EPOS 系统 的 公司 非常 地 不 满意 , 那 次 我 报告 了 一 个 与 他 们 的 报 
告 有 关 的 问题 。 在 他 们 的 “每 日 最 终 ” 报告 中 有 一 个 数字 总 是 有 错误 。 他们 只 是 告诉 我 ， 
他 们 知道 自己 在 做 什么 ， 而 我 是 不 正确 的 。 他 们 等 定 我 是 一 个 用 户 ， 于 是 也 “不 专业 ”， 
故而 也 不 可 能 得 出 正确 的 判断 。 甚 至 当 我 告诉 他 们 我 是 培训 会 计 师 ( 因 此 知道 得 很 清楚 ， 
“每 日 最 终 ” 财务 报告 上 的 这 个 数字 是 错误 的 ), 而 且 对 软件 开发 也 有 一 定 程度 的 了 解 的 
时 候 ， 他 们 仍旧 根本 不 把 我 说 的 话 放 在 心 上 。 这 个 问题 一 直 没 有 得 到 解决 ， 因 此 我 们 只 
有 采用 其 他 变通 方法 ， 因 为 我 们 能 够 这 样 做 。 然 而 ， 那 家 公司 却 给 我 留 下 了 傲慢、 愚昧 、 
不 信任 用 户 的 持久 印象 。 我 再 也 没有 费事 与 他 们 联系 提出 任何 疑问 ， 更 不 用 说 升级 建议 。 
而 且 我 们 再 也 不 会 购买 他 们 的 任何 软件 。 


误解 不 是 用 户 的 专利 


具有 智慧 是 成 为 一 个 好 的 软件 工程 师 的 必要 条 件 。 我 们 中 的 大 多 数 人 在 学 校 里 都 有 很 好 
的 成 绩 ， 都 为 自己 的 智 起 而 骆 做 ， 但 这 并 不 能 保证 我 们 不 会 犯错 。 


当 存 在 非常 明显 的 误解 的 时 候 ， 请 记 住 ， 有 可 能 是 你 出 错 了 。 你 可 能 对 软件 更 了 解 ， 但 
在 应 用 领域 你 可 能 并 不 会 比 用 户 理解 更 好 ， 因 为 这 是 他 们 的 专长 。 





3. 发 布 你 的 缺陷 数据 库 


让 你 的 缺陷 跟踪 系统 对 于 所 有 的 用 户 来 说 都 是 可 用 的 。 ”如 果 之 前 你 并 没有 做 这 方面 的 事情 ， 
那么 让 大 家 看 到 你 的 “爆料 ”可 能 是 很 可 怕 的 事情 ， 但 它 带 来 的 好 处 是 巨大 的 。 
O 鉴于 你 认真 对 待 用 户 的 报告 ， 及 时 给 予 反 馈 ， 最 终 解 决 报告 中 的 问题 ， 这 样 会 给 用 户 信 
心 ， 让 他 们 觉得 确实 值得 花 时 间 来 做 好 报告 。 
o 如 果 用 户 在 报告 缺陷 之 前 就 能 搜索 你 的 缺陷 数据 库 ， 就 会 大 大 减少 重复 的 缺陷 报告 。 
o 一 个 用 户 看 到 别人 的 缺陷 报告 时 可 能 会 深 有 体会 ， 这 便 会 提供 重要 线索 让 你 解 开 他 的 难 


题 。 
o 了 解 已 有 的 缺陷 报告 对 那些 并 不 知道 如 何 编写 缺陷 报告 的 用 户 来 说 是 很 好 的 办 法 。 


O 如 果 你 使 用 托管 的 方法 的 话 这 是 非常 容易 实现 的 〈A.1 节 提 供 了 一 些 选择 ) 。 
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如 果 你 决定 要 发 布 缺 陷 数 据 库 , 那么 要 让 你 的 用 户 知 道 ,他 们 往 缺 陷 报 告 里 添加 的 信息 将 会 
被 公开 。 

隐私 问题 

比尔 。 卡 温 


在 一 家 我 曾经 任职 的 公司 里 ,技术 支持 维护 了 缺陷 数据 库 很 多 年 ,并 一 直 假 定 它 是 
保密 的 。 当 用 户 想 让 我 们 发 布 这 个 数据 库 时 ， 我 们 不 能 发 布 ， 因 为 里 面 全 都 是 一 些 用 户 
的 私人 信息 ， 包 括 姓名 、 电 话 号 码 、IP 地 址 等 。 


4. 提供 反馈 
当 某 个 用 户 提 交 缺 陷 报告 时 ， 需 要 积极 回应 并 支持 他 们 继续 下 去 。 


这 不 一 定 是 一 个 繁重 的 任务 。 许 多 缺陷 追踪 系统 都 有 这 样 的 功能 ， 就 是 每 当 缺 陷 系 统 的 状态 
改变 时 ， 都 会 以 电子 邮件 的 方式 发 送 给 感 兴趣 的 人 。 只 要 你 一 直 保证 及 时 更 新 缺陷 追踪 系统 ,这 
个 功能 将 确保 让 报告 了 错误 的 人 以 及 你 认为 恰当 的 人 ， 都 得 到 最 新 状态 通知 。 


5. 拜访 用 户 


当 遇 到 真正 棘手 的 问题 , 没有 什么 比 拜 访 用 户 更 加 有 效 了 。 拜访 用 户 可 以 比 任何 缺陷 报告 了 
解 得 更 多 。 
双击 事件 


我 曾经 测试 了 一 个 表面 上 看 似 非 常 简单 的 缺陷 。 缺 陷 报告 描述 了 用 户 界 面 操作 的 简 
短 步 又 ， 并 声称 缺陷 可 以 被 完全 准确 地 重 现 。 但 是 我 尝试 了 很 多 次 ， 也 没 能 重 现 ， 最 终 
只 能 认为 “我 这 里 运行 正常 ”。 

几 分 钟 后 ， 报 告 它 的 项 目 经 理 旧 事 重 提 ， 并 让 我 走 到 他 的 办 公 桌 前 ， 在 那里 他 向 我 
展示 了 几 次 ， 完 全 准确 地 重 现 了 缺陷 。 


HEHE, 无 论 何 时 当 我 试图 重 现 它 时 一 一 就 在 他 的 机 器 上 , 项 目 经 理 在 一 旁 盯 着 ， 
保证 我 是 以 相同 的 操作 步骤 进行 操作 的 一 一 仍然 就 是 没 能 重 现 缺 陷 。 


最 终 我 们 找到 了 我 们 之 间 操 作 的 差别 , 我 双击 鼠标 的 时 候 总 是 把 鼠标 放 在 同一 个 位 
置 上 ， 但 是 ， 他 在 两 次 点 击 鼠 标 时 移动 了 非常 轻微 的 距离 。 他 只 移动 了 几 个 像素 ， 但 是 
这 足以 导致 结果 的 不 同 。 


如 果 没 有 亲自 看 着 对 方 使 用 该 软件 ， 我 们 是 决 不 会 发 现 的 。 
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6.3 与 支持 人 员 协 同 工 作 


大 多 数组 织 会 聘用 那些 不 直接 参与 软件 开发 过 程 的 技术 人 员 或 半 技 术 人 员 。 客 户 支持 、 
QA (Quality Assurance， 质 量 保证 )、 客 户 工程 师 、 技 术 客户 经 理 等 都 可 以 在 调试 过 程 中 提供 
帮助 。 


您 的 QA 团队 不 仅 可 以 在 缺陷 出 现 之 前 帮 你 检测 到 缺陷 。 他 们 的 专业 知识 和 观点 也 在 你 努力 
要 找到 或 改进 重 现 的 时 候 对 你 特别 有 帮助 。 也 许 你 可 以 考虑 和 QA 团队 的 一 名 同事 在 诊断 阶段 一 
同 工 作 ? 


一 个 良好 的 客户 支持 团队 能 够 动用 他 们 所 有 的 客户 关系 以 及 专业 知识 来 凸显 其 在 缺陷 修复 
中 的 价值 ,尤其 在 帮助 我 们 解决 沟通 问题 方面 ， 这 个 价值 是 不 可 估量 的 ， 这 些 问 题 我 们 在 本 章 前 
面 已 讨论 过 。 他 们 应 该 能 够 判断 并 确保 所 有 相关 信息 被 确认 ， 得 到 沟通 ， 并 避免 次 毛 求 症 以 及 一 
切 无 关 紧要 的 环节 。 你 可 能 会 考虑 要 求 他 们 执行 一 项 特定 进程 ,来 提高 此 领域 缺陷 报告 的 质量 ( 见 
接 下 来 的 “特性 描述 ”) 。 


无 论 客户 支持 团队 多 么 体贴 地 站 在 你 的 角度 去 和 用 户 
沟通 ， 你 也 存在 被 用 户 封杀 的 危险 。 为 促进 与 用 户 的 亲密 STORTI a 
理解 ， 赢 得 更 多 用 户 的 心 ， 表 明 你 愿 有 效 地 为 他 们 开发 软 。 occasionally. 
件 ， 你 可 以 考虑 偶尔 做 一 下 客户 支持 。 这 不 仅 可 以 帮助 你 
了 解 用 户 ,而 且 没 有 什么 比 这 样 做 更 能 认可 你 的 客户 支持 部 门 的 同事 所 面临 的 挑战 了 ,这 样 做 表 
达 了 对 他 们 能 力 的 尊重 。 








QA 的 万 里 长 城 


由 于 QA 团队 所 具有 的 价值 主要 是 提供 了 不 同 的 视角 ,因此 他 们 需要 守护 的 是 避免 
与 开发 团队 先入 为 主 的 观念 “ 同 流 合 污 "。 但 是 ， 也 容易 做 得 过 火 。 


我 曾经 工作 过 的 公司 里 QA 团队 与 开发 团队 之 间 有 很 深 的 隔 阅 一 一 我 们 甚至 都 不 能 
与 测试 团队 谈 工 作 。 唯 一 可 以 从 开发 田 队 到 测试 团队 的 信息 是 一 个 已 编译 的 二 进 制 文 
件 。 唯 一 能 得 到 双方 回应 的 信息 就 是 “通过 ”或 “失败 "”。 

当 我 问 创建 这 个 组 织 结构 的 设计 师 时 ,他 回答 说 ， 如 果 允 许 我 们 与 测试 团队 进行 交 
K, 我 们 就 有 可 能 为 了 通过 测试 来 开发 软件 ， 这 是 “ 作 兽 ”的 行为 。 虽 然 理论 上 这 有 可 
能 说 得 过 去 ， 但 是 这 剂 狸 药 却 比 要 治 的 病 产 生 的 危害 还 要 大 。 
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特性 描述 


有 时 在 把 缺陷 转交 给 开发 团队 诊断 之 前 , 对 其 进行 特性 描述 很 有 ' 必 要。 这 并 不 适用 所 有 
情况 ， 但 可 能 是 非常 有 用 的 ， 尤 其 对 大 型 的 项 目 和 团队 。 


特性 描述 与 诊断 之 间 的 界线 是 模糊 的 ， 但 大 致 来 说 ， 这 是 一 个 黑 盒 的 过 程 ， 发 生 在 软件 
“外 部 ”而 不 考虑 其 内 部 工作 原理 。 与 之 相反 ， 诊 断 是 一 个 白 盒 过 程 。 


特性 描述 的 目的 是 要 寻找 缺陷 “边界 "。 它 可 以 可 靠 地 重 现 吗 ? 它 可 以 发 生 在 不 同 的 平 
台 上 还 是 只 在 单一 的 平台 上 ? 多 样 的 输入 仍然 会 重 现 该 问题 吗 ? 如 果 是 ， 又 是 怎样 的 呢 ? 





在 下 一 章 ， 我 们 将 注意 力 转向 心理 学 ， 一 种 有 效 的 调试 思维 模式 是 什么 样 呢 ? 


6.4 ” 付 诸 行动 
口 充分 利用 缺陷 追踪 系统 。 
里 复杂 度 要 适中 ， 根 据 具体 情况 作出 选择 。 
s 直接 面向 用 户 。 
s 自动 化 环境 和 配置 报告 ， 以 确保 报告 的 准确 性 。 
缺陷 报告 要 达到 如 下 目标 。 
里 具体 的 
m 明确 的 
= 详细 的 
m 最 小 化 的 
独特 的 
与 用 户 合作 时 ， 应 该 做 到 以 下 几 点 。 
mw 尽 可 能 地 简化 缺陷 报告 流程 。 
s 沟通 是 关键 ， 多 为 用 户 设身处地 着 想 。 
O 与 客户 支持 部 和 QA 团队 搞 好 关系 ， 以 便 在 缺陷 修复 的 过 程 中 得 到 帮助 。 
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第 / z 
务实 的 零 容 忍 策略 


如 何 能 把 缺陷 修复 与 更 广泛 的 软件 开发 过 程 相 结合 呢 ? 如 何 估计 要 花 多 长 时 间 去 修复 一 个 
缺陷 或 软件 中 所 有 的 缺陷 呢 ? 如 何 确 保 你 的 项 目 不 会 像 Brooks 在 《人 月 神话 》[Bro95] 中 形象 地 
描述 的 那样 陷入 无 数 缺 陷 修复 的 焦油 坑 中 呢 ? 


在 这 一 章 中 ， 我 们 将 讨论 以 下 内 容 : 
a 什么 时 候 修 复 缺 陷 ， 


o 调试 的 思维 模式 ， 
Q 自己 如 何 解决 质量 问题 。 


7.1 缺陷 优先 


- 些 团队 会 选择 立即 修复 那些 刚刚 出 现 的 缺陷 (早期 缺陷 修复 )， 而 有 些 团队 会 把 这 些 缺 陷 
放 在 一 边 ， 直 到 开发 过 程 完成 后 再 去 修复 它们 (后 期 缺陷 修复 )。 到 目前 为 止 ， 早 期 缺陷 修复 是 
一 个 更 好 的 策略 。 


早期 缺陷 修复 基于 两 个 原则 。 


O 那些 可 能 发 现 缺 陷 的 过 程 ( 比 如 测试 、 代 码 审查 、 让 用 户 使 用 软件 ) 要 连续 地 贯穿 于 整 
个 开发 过 程 中 。 
o 缺陷 修复 优先 于 其 他 任何 事情 。 


这 样 做 的 目的 就 是 保证 软件 中 存在 的 缺陷 数量 (包括 已 经 找到 的 和 尚未 找到 的 缺陷 ) 尽 可 能 
地 少 。 
7.1.1 早期 缺陷 修复 可 以 大 大 降低 软件 运行 的 不 确定 性 

开始 寻找 缺陷 时 ， 你 才 知 道 还 有 多 少 剩余 的 缺陷 需要 查找 。 开 始 修复 它们 时 ， 你 才 知道 需要 
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花费 多 少时 间 去 完成 这 一 修复 早期 的 缺陷 检测 和 修复 能 帮助 你 估算 在 缺陷 修复 上 大 约 需要 多 少 
时 间 并 且 依 此 来 修改 你 的 测试 计划 。 而 后 期 缺陷 修复 模式 会 给 你 一 种 你 一 直 在 进步 的 错觉 ,其实 
你 只 不 过 是 一 直 在 积累 技术 债务 而 已 一 潜伏 在 软件 表面 下 的 一 堆 问题 。 你 可 能 不 知道 什么 时 候 
能 够 修复 它们 ， 因 为 你 不 可 能 预测 到 还 有 多 少 问题 等 待 你 去 发 现 。 


我 们 可 以 通过 图 7-1 看 到 这 个 过 程 。 在 项 目 A 中 (在 上 面 ), 缺陷 被 尽 可 能 快 地 发 现 和 修复 。 
结果 ,我 们 能 测量 真实 的 开发 速度 并 且 精 确 地 预测 我 们 离 完成 项 目 (消除 缺陷 ) 还 有 多 远 。 对 比 
一 下 项 目 B (AEP), 我们 把 测试 和 缺陷 修复 留 到 最 后 ， 到 那个 时 候 ， 我 们 不 知道 还 有 多 少 缺 
陷 需 要 修复 ， 也 不 知道 需要 多 少时 间 来 修复 。 我 们 下 周 会 做 完 吗 ? 下 个 月 呢 ? 还 是 六 个 月 ? 真 的 
没有 办 法 确定 ， 因 为 ， 即 使 我 们 知道 还 有 多 少 要 做 (实际 是 不 知道 )， 我 们 也 没有 历史 数据 来 帮 
助 我 们 估计 会 花费 多 少时 间 修 复 。 


Coe WW 
项 目 A 






eC (‘iw 


是 否 完成 ? 是 否 完成 ? 是 否 完成 ? 
时 间 一 一 > 


图 7-1 早期 检测 与 修复 缺陷 带 来 确定 性 
7.1.2 没有 破 窗 户 


编写 , 特别 是 维护 软件 ,是 一 个 持续 的 与 炉 抗 争 的 过 程 ， 在 这 个 过 程 中 始终 保持 最 高 质量 是 
非常 困难 的 ,这 需要 高 水 平 的 自律 。 这 种 自律 即使 是 在 最 好 的 情况 下 也 很 难 维持 , 更 不 用 说 当 你 
面 对 软 件 有 个 长 期 没有 修复 的 缺陷 这 样 的 事实 了 。 只 要 这 种 自律 稍 有 松懈 , 那么 质量 就 进入 一 个 
雪上 加 霜 的 恶性 循环 中 ， 这 时 你 就 真 的 陷入 困境 之 中 了 。 

很 多 问题 具有 累加 效应 ， 质 量 低下 具有 传染 性 ， 唯 一 
斌 量 俄 下 具有 传 杂 性 。 确定 的 解决 办 法 就 是 一 旦 发 现 缺 陷 就 立刻 解决 它们 。 我 们 
Poor quality is contagious 的 目标 就 是 从 始 到 终 都 要 保持 缺陷 的 数量 为 零 (或 接近 于 

零 )。 这 种 方法 通常 被 称 为 没有 破 窗户 ”。 








@ 这 种 说 法 最 初 是 在 Andy Hunt 和 Dave Thomas 的 《程序 员 修 炼 之 道 》[HT00] 一 书 中 被 用 在 软件 方面 并 流行 起 来 的 。 
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W 小 乔 要 问 
过 我 如 何 估计 修复 一 个 缺陷 要 用 多 少时 间 

一 盘 情 况 下 ,是 不 可 能 估计 一 个 特定 的 抽 陷 修复 需要 多 少时 间 的 。 问 题 的 诊断 实质 上 是 
不 确定 的 ， 只 有 解决 了 不 确定 因素 后 ， 所 做 的 估计 才 是 有 价值 的 。 


一 旦 你 完成 了 诊断 ， 吕 可 能 对 修复 一 个 缺陷 需要 多 长 时 间 进行 一 个 准确 的 估计 ， 但 是 ， 
这 对 你 不 会 有 很 大 的 帮助 ， 因 为 对 大 多 数 的 缺陷 ， 问 题 的 诊断 是 最 耗 时 的 。 


然而 ,我 们 并 没有 失去 什么 。 虽 然 你 不 能 估计 出 修复 一 个 特定 的 缺陷 所 需要 的 时 间 ， 但 
是 可 以 得 到 关于 缺陷 数量 的 一 些 有 用 的 统计 数据 。 因此， 在 你 发 布 软件 的 前 一 个 阶段 ， 如 果 
你 统计 上 周平 均 修 复 的 缺陷 数量 是 20 个 的 话 ， 那 么 有 理由 估计 你 可 能 在 下 周 修复 同样 数目 
的 缺陷 。 


FIRS LAI LAR, 如果 我 们 尽早 地 发 现 并 修复 缺陷 , 就 会 很 快 知道 我 们 需要 
花费 多 少时 间 去 进行 调试 才能 得 到 无 缺陷 的 软件 。 更 理想 的 情况 是 ,我 们 不 去 推测 ,我 们 只 
| 去 计量 花费 在 修复 缺陷 上 的 时 间 。 








我 们 中 的 很 多 人 都 被 “死亡 之 旅 ” 项 目 折磨 得 筋 疲 力 
尽 ， 一 个 成 功 地 遵循 “没有 破 窗户 ” 策 赂 的 项 目 侯 平 是 起 从 第 一 天 
个 不 切实 际 的 幻想 。 但 是 ， 如 果 你 在 早期 就 发 现 了 缺陷 ， Se rai 
并 且 从 一 开始 就 这 么 做 ， 这 样 的 项 目 还 是 很 有 可 能 实现 so from day one. 

的 。 这 样 ， 未 解决 缺陷 的 数量 (包括 那些 你 知道 的 和 尚未 
发 现 的 ) 将 是 可 控 的 。 


7.2 ”调试 的 思维 模式 

我 们 已 经 看 到 ， 调 试 首先 是 一 种 心理 活动 。 健 康 的 调试 心态 ， 在 工作 中 是 很 难 一 直 存 在 的 。 
有 时， 可 能 感觉 好 像 你 已 经 进入 了 《爱丽 丝 奇 境 历险 记 》[Car 71] 的 世界 。 

爱丽 丝 ， 再 试 也 没 用 ， 人 们 不 可 能 去 相信 不 可 能 发 生 的 事 。 


怀特 女王 : 我 敢 说 你 练 得 还 很 不 够 。 我 在 你 这 么 大 的 时 候 ， 每 天 做 它 半 个 小 时 。 有 时 在 
早餐 前 ， 我 就 相信 有 不 可 能 的 事情 要 发 生 。 


天 真 地 说 ,“ 没 有 破 窗户 ”的 方法 也 可 以 被 理解 为 只 有 绝对 完美 的 情况 下 才能 实现 。 但 是 ， 
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任何 参加 过 软件 开发 项 目的 人 都 知道 , 缺陷 是 不 可 避免 的 , 无 论 你 多 么 努力 , 总 会 遗漏 一 些 问题 ， 
那么 ， 我 们 该 如 何 解 决 这 个 难题 呢 ? 


一 方面 , 我 们 可 以 认为 缺陷 是 不 可 避免 的 , 不 去 担心 缺陷 的 发 生 , 接受 总 会 有 缺陷 这 一 事实 。 
虽然 这 是 基本 事实 , 但 是 这 种 逻辑 会 得 出 一 个 有 害 无 益 的 宿命 论 一 一 不 要 为 存在 缺陷 而 担心 ， 它 
们 是 软件 开发 中 不 可 避免 的 , 而 你 无 能 为 力 。 不 要 强迫 自己 疲 于 实现 那些 不 可 能 的 事情 ,你 只 需 
处 理 那些 出 现 的 缺陷 。 


另 一 方面 ， 作 为 有 责任 心 的 软件 开发 人 员 ， 我 们 的 目标 就 是 创造 价值 并 且 为 此 而 感到 骄傲 ， 
我 们 要 精益 求 精 。 绝 对 不 能 容忍 任何 缺陷 ! 不 幸 的 是 ， 虽然 我 们 非常 用 心 ， 如果 采用 这 种 逻辑 理 
论 , 还 是 可 能 起 不 到 什么 作用 , 我 就 看 到 过 它 如 何 导致 脆弱 软件 的 诞生 一 一 如 果 从 开始 就 没有 失 
Weick, 那 为 什么 要 花 时 间 去 写 一 个 具有 故障 安全 功能 的 软件 ? 这 意味 着 当 不 可 避免 的 缺陷 确实 被 
遗漏 了 ,我 们 通常 会 感觉 自己 好 像 已 经 失败 了 。 最 坏 的 结果 是 ， 它 会 导致 团队 成 员 之 间 的 互相 指 





W 小 乔 爱问 
Y 是 缺陷 还 是 特性 


如 果 你 要 采取 “无 破 窗户 ”策略 ,打算 在 其 他 开发 进程 之 前 解决 所 有 缺陷 ， 你 可 能 很 快 
就 会 发 现 自 己 无 法 判定 “ 它 是 缺陷 还 是 特性 "。 

从 客户 的 角度 来 看 ， 这 个 问题 一 点 儿 意义 都 没有 。 客 户 只 知道 软件 出 问题 了 ， 需 要 你 来 
修复 。 是 缺陷 还 是 特性 这 个 问题 在 客户 眼 里 就 如 同 “ 有 多 少 天 使 能 够 在 大 头 针 上 跳舞 ”一 样 


KF 


但 是 ， 从 “没有 破 窗户 ”需求 考虑 ， 缺 陷 和 特性 之 间 的 差别 至 关 重 要 。 你 肯定 不 希望 你 
精心 安排 的 工作 顺序 被 重新 定义 缺陷 和 特性 这 个 小 问题 打 乱 ,你 也 不 想 因为 搞 混 了 缺陷 和 特 
性 而 使 软件 质量 大 打折 扣 。 

幸好 两 者 很 容易 区 分 。 缺 陷 是 无 意识 行为 ， 在 此 情况 下 软件 不 按照 既定 设计 运行 。 除 此 
之 外 都 是 特性 ， 软 件 就 是 按照 设计 来 运行 的 。 


当然 ， 客 户 抱 忽 的 是 特性 并 不 是 说 就 不 需要 改进 软件 ， 而 是 说 问题 没 那么 严重 。 





因此 ， 如 果 这 两 个 极端 都 是 无 益 的 ， 那 么 我 们 应 该 把 目标 设 定 在 这 两 个 极端 之 间 的 哪里 
呢 ? 
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最 有 成 效 的 思维 模式 是 务实 的 零 容 忍 策略 一 非常 接 RSERLSLEER, 
近 于 零 容忍 ， 但 是 用 务实 的 心态 去 实现 (图 7-2)。 Temper perfectionism with 
Pragmatism 。 
顺 其 自然 完美 
Pragmatic 
BAZ, 


图 7-2 务实 的 零 容 忍 策略 


我 们 需要 表现 得 好 像 开 发 没有 缺陷 的 软件 是 一 个 可 以 实现 的 目标 一 一 不 遗 余力 , 不 忽略 任何 
可 能 帮助 我 们 接近 这 个 目标 的 工具 和 技术 。 当 一 个 缺陷 确实 被 遗漏 了 的 时 候 , 我 们 应 该 从 这 个 缺 
陷 中 学 到 很 多 经 验 ， 采 取 一 切 措施 确保 同样 的 缺陷 不 再 发 生 。 

当 我 们 现实 地 张望 离 想 要 达到 的 最 终 目 标 有 多 近 的 时 候 ， 我 们 需要 做 到 所 有 这 些 。 是 的 , 我 
们 要 残忍 地 苛求 自己 去 寻找 任何 可 能 产生 的 错误 ， 但 是 ， 当 我 们 功 亏 一 筑 要 被 责备 的 时 候 ， 不 能 
将 自己 击 倒 了 。 我 们 需要 知道 ， 在 打造 一 个 发 布 伊始 就 很 强劲 的 软件 的 过 程 中 ， 缺 陷 是 存在 的 ， 
是 不 可 避免 的 。 

这 是 肯定 的 ， 缺 陷 一 定 会 存在 的 思想 会 使 我 们 有 点 松懈 (仅仅 是 一 点 ) ， 我 们 远 远 做 不 到 完 
美 ， 但 是 我 们 可 以 用 正确 的 方法 无 限 地 接近 它 。 


7.3 自己 来 解决 质量 问题 


有 时， 你 会 发 现 自己 正面 对 一 个 包含 很 多 缺陷 的 代码 集 。 这 种 情况 也 许 是 你 自己 造成 的 ， 也 
有 可 能 是 你 接手 别人 的 代码 时 就 已 经 这 样 了 .不管 是 哪 种 情况 都 没关系 。 如果 你 面 对 大 量 的 缺陷 ， 
你 如 何 才 能 摆脱 困境 呢 ? 


7.3.1 这 里 没有 “灵丹妙药 ” 


一 个 令 人 失望 的 事实 就 是 ， 没 有 快速 修复 缺陷 的 方法 ， 虽 然 会 有 一 些 有 用 的 策略 ， 但 是 解决 
问题 的 唯一 可 靠 的 方法 就 是 修复 所 有 的 缺陷 ， 当 然 ， 这 需要 投入 大 量 的 时 间 、 精 力 ， 还 有 奉献 精 
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神 。 没 有 任何 捷径 也 没有 任何 免费 的 午餐 。 


从 纯粹 主义 者 的 角度 来 看 , 一 个 显而易见 的 解决 方案 就 是 停止 开发 程序 , 并 且 通 知 其 他 人 在 
你 没有 很 好 地 控制 质量 问题 前 ， 不 要 进行 任何 新 的 开发 。 不 幸 的 是 , 大 多 数 的 组 织 不 会 对 你 说 的 
在 接 下 来 的 六 个 月 不 发 布 任何 新 的 功能 产生 什么 好 的 反应 。 


那么 ， 你 应 该 怎么 做 呢 ? 
7.3.2 ”停止 开发 那些 有 缺陷 的 程序 


你 首先 要 做 的 是 设法 阻止 事情 恶化 。 你 可 能 无 法 立即 让 现 有 的 所 有 代码 都 达到 标准 , 但 是 你 
能 确保 所 有 新 的 代码 都 不 会 出 现 同 样 的 错误 。 


如 果 你 还 没有 把 基本 要 素 准 备 好 ， 那 么 第 一 步 就 应 该 
把 它们 做 好 一 一 没有 它们 ， 你 只 会 让 自己 更 深 地 陷入 到 已 
经 置身 的 问题 中 。 这 意味 着 至 少 要 做 到 以 下 几 点 :…” 


BITE, REKR. 
Put the basics in place. 


O 控制 源 代码 ， 

a 一 个 完全 自动 化 的 生成 系统 ; 
口 一 个 完全 自动 化 的 测试 工具 ， 
Q 可 以 连续 构建 或 集成 代码 。 


一 旦 这 些 都 到 位 ,你 要 确保 使 用 它们 。 你 在 试 着 逆转 粮 , 但 是 它们 是 不 会 被 轻易 解决 的 。 改 
进 质量 要 比 从 一 开始 就 构建 或 维护 它 难得 多 。 
7.3.3 ”从 “不 干净 ”的 代码 中 将 “干净 ”的 代码 分 离 出 来 

一 个 你 将 要 去 面 对 的 挑战 是 ， 你 将 要 面 对 “ 破 窗户 ”效应 的 影响 
你 需要 坚强 的 意志 来 避免 它 对 你 的 影响 。 


一 个 好 的 策略 可 以 很 清楚 地 划分 “干净 ”( 书 写 良好 的 、 测 试 良好 的 、 被 调试 过 的 ) 代码 和 
“不 和 干净” 代码， 一 定 确保 小 组 中 的 人 都 知道 “干净 ”代码 的 含义 。 : 
每 当 你 有 机 会 去 做 的 时 候 , 都 要 借助 这 个 机 会 努力 地 了 解 旧 代码 的 一 些 边界 代码 。 如 果 你 正 
在 做 这 些 代码 , 一 定 要 编写 并 测试 你 找到 的 任何 错误 还 有 其 他 一 些 你 接触 到 的 问题 。 一 段 经 过 时 
闻 后 ， 经 过 一 点 一 滴 的 积累 ,你 会 发 现 已 经 成 规模 创建 了 测试 ， 并 涵盖 了 大 量 的 代码 库 。 至 少 在 





当 你 被 破 窗户 包围 时 ， 


D 我 们 将 在 第 9 章 中 详细 讨论 。 
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当前 运行 的 所 有 代码 区 域 (从 质量 来 看 ， 这 可 能 是 最 引 人 关 注 的 ) ， 最 后 都 应 当 得 到 良好 的 合理 
的 测试 。 

用 木板 挡住 破 窗户 


在 《程序 员 修 炼 之 道 》 中 ,Andy Hunt 和 Dave Thomas 曾 指出 , 有 时 , 你 可 能 考虑 过 “用 
木板 挡住 ” 破 窗 户 。 


“如 果 没 有 足够 的 时 间 去 恰当 地 修复 它 ， 那 么 阻 断 它 ， 你 可 以 注释 挤 这 段 你 不 喜欢 的 代 
码 ， 或 是 标记 一 个 “未 实现 ”信息 ， 或 是 找 个 虚拟 的 数据 代替 它 ， 以 防止 这 段 代 码 对 程序 进 


一 步 的 损坏 ， 并 表示 你 还 掌控 着 局 面 。 


这 种 方法 的 一 个 变化 形式 是 采用 沙 箱 模型 来 解决 问题 模块 。 如 果 这 段 代码 本 身 对 你 来 说 
太 可 怕 ， 而 你 没有 足够 的 信心 去 修复 它 ， 那 么 尽 可 能 地 把 这 段 代码 从 周围 代码 中 分 离 出 来 ， 
控制 它 的 接口 ,这样 你 可 以 准确 地 知道 它 是 如 何 被 使 用 的 ， 并 能 验证 它 返回 的 结果 。 随 着 时 
间 的 推移 ， 你 最 终 能 够 去 除 或 重 写 它 。 





7.3.4 ”错误 分 类 


在 许多 团队 面临 越 来 越 大 的 缺陷 数据 库 时 ， 他 们 会 选择 一 些 特点 将 缺陷 进行 分 类 ”， 这 种 分 
类 会 议 旨 在 构成 可 以 查看 的 缺陷 列表 , 无 论 新 旧 , 都 要 确保 你 清楚 地 知道 它们 的 含义 和 它们 相互 
间 的 优先 级 。 

你 会 发 现 这 些 分 类 会 议 可 能 是 最 伤 脑筋 最 花 时 间 的 “一 PeeneRLANBRT 
T. TAIRA, IEAM RMS ORME BE MARRER OE SHR, 
源 的 约束 下 你 不 能 权衡 的 错误 。 不 过 ， 如 果 你 发 现 身 处 在 Priovitizing bugs requires on 
很 多 没有 解决 的 缺陷 当中 时 ， 就 很 难 能 找 到 一 个 好 的 方法 “ -eVieN oF the entire bug database. 
来 管理 这 一 进程 。 一 些 人 需要 对 数据 库 有 个 概述 性 的 了 解 ， 以 全 能 够 作出 艰难 的 权衡 ,做 到 这 点 
唯一 的 途径 就 是 要 定期 更 新 数据 库 ， 并 保证 新 被 创建 的 条 目 有 着 合理 的 优先 级 。 


英雄 主义 的 价值 
比尔 。 卡 温 

在 一 项 工作 中 ,我们 创造 了 一 个 比喻 后 来 成 为 笑话 在 流行 。 我们 已 经 到 了 提交 产品 
之 前 的 最 后 一 个 礼拜 了 ,但 是 仍然 有 一 些 早期 标识 为 高 优先 级 的 缺陷 没有 解决 。 它们 当 


有 时 又 称 它 为 缺陷 擦 除 会 议 ( 从 清除 缺陷 的 意义 上 说 )。 
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中 只 有 一 些 能 够 被 修复 。 我 要 求 大 家 现在 去 想象 一 下 ,我 们 的 产品 还 有 这 么 多 错误 ， 卡 
车 就 装载 着 我 们 “完成 ”的 产品 要 离开 。 你 是 否 会 有 强烈 的 感觉 我 们 不 能 让 这 些 错 误 
到 达 用 户 的 手中 , 于 是 你 要 奋不顾身 地 冲 上 前 去 , 模 身 在 车 轮 下 ? 当然 , 这 是 一 个 笑话 。 
它 让 我 们 有 点 参照 背 景 ， 有 助 于 让 我 们 判断 留 下 的 高 优先 级 错误 是 否 都 是 那么 重要 ， 需 
要 我 们 像 个 英雄 一 样 挺 身 而 出 。 在 一 些 情况 下 ， 是 这 样 的 ， 但 是 在 另外 一 些 情况 下 ， 人 
们 不 得 不 承认 错误 还 是 足够 的 温和 的 。 


7.3.5 缺陷 闪电 战 


现在 有 一 个 流行 的 策略 被 一 些 团队 采用 , 那 就 是 建立 缺陷 闪电 战 (有 时 也 被 称 为 缺陷 大 集合 
或 类 似 的 说 法 )。 在 一 个 相对 较 短 的 时 间 内 (一 天 、 一 周 ， 也 许 是 一 个 迭代 周期 )， 团 队 中 的 所 有 
成 员 除了 修复 缺陷 之 外 不 做 任何 工作 。 


这 样 做 的 目的 是 在 可 用 的 时 间 内 尽 可 能 地 降低 没有 解决 的 缺陷 的 数量 ， 忽 略 它 们 的 优先 级 。 
通常 , 这 意味 着 一 些 简单 的 缺陷 一 一 会 因为 它们 太 不 重要 而 被 忽视 掉 一 一 获得 了 修复 的 时 间 和 关 
注 度 。 

做 得 好 的 话 ,缺陷 闪电 战 可 以 获得 实际 上 的 和 心理 上 的 双重 收益 ， 它 帮助 我 们 将 缺陷 的 数量 
控制 在 可 以 管理 的 水 平 上 , 能 帮助 我 们 既 见 树木 又 见 森 林 ， 还 会 让 一 个 已 经 疲劳 或 士气 低落 的 团 
队 看 到 他 们 其 实 还 在 进步 中 。 


一 旦 你 开始 能 够 控制 质量 问题 ， 你 就 想 重 构 那 些 旧 的 、 粗 糙 的 、 未 经 过 测试 的 代码 。 你 
应 该 这 样 去 做 一 一 关键 是 清除 所 有 的 问题 ， 而 重 构 就 是 这 一 过 程 的 关键 要 素 。 


但 是 ,请 记 住 ， 重 构 非 常 依赖 于 一 个 广泛 的 自动 化 测试 套件 的 支持 。 没 有 测试 ， 你 就 不 
是 在 重 构 ， 而 是 在 hack 了 。 

那么 , 你 如 何 重 构 未 经 测试 的 代码 ? 你 不 要 重 构 未 经 测试 的 代码 ,你 第 一 件 要 做 的 事情 
就 是 编写 测试 。 





然而 ,这 是 一 种 需要 谨慎 使 用 的 技术 。 在 短期 内 , 缺陷 闪电 战 可 能 是 很 有 趣 的 一 一 大 家 都 在 
一 起 , 缺陷 的 数量 明显 降低 ， 公 司 提供 比萨 。 但 是 它 的 乐趣 只 是 很 短 的 一 段 时 间 内 ， 它 很 快 就 能 
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使 人 疲 备 。 我 们 需要 感觉 到 自己 在 进步 ， 数 周 的 除了 缺陷 修复 还 是 缺陷 修复 的 工作 会 累 垮 每 一 
个 人 。 


你 还 需要 记 住 , 缺陷 闪电 战 的 目标 就 是 要 提高 软件 的 整体 质量 。 这 意味 着 你 不 能 在 正常 的 过 
程 中 偷工减料 一 一 检查 和 权衡 都 是 有 目的 的 ， 而 且 都 只 适用 于 缺陷 闪电 战 。 


7.3.6 专项 小 组 


专项 小 组 是 缺陷 闪电 战 的 一 个 轻微 变化 一 一 一 个 小 组 在 有 限 的 时 间 里 聚集 在 一 起 , 为 了 解决 
特殊 的 质量 问题 。 


如 果 你 明确 了 问题 域 一 一 例如 ， 某 个 包含 不 可 接受 的 大 量 缺 陷 的 模块 ， 这 将 是 一 个 特别 适用 
的 方法 。 典 型 的 专项 小 组 ， 由 该 小 组 中 最 好 的 、 最 有 经 验 的 队员 组 成 ， 他 们 能 够 找到 问题 产生 的 
根本 原因 ， 拥 有 正确 的 技能 和 技术 ， 能 够 一 次 性 地 解决 问题 。 


在 本 书 的 下 一 部 分 ,我们 会 看 到 一 些 需要 特别 留心 的 特殊 案例 , 告诉 我 们 如 何 建立 一 个 帮助 
修复 缺陷 而 不 是 阻碍 修复 缺陷 的 环境 ， 并 且 避 免 一 些 陷阱 。 


7.4 付 诸 行动 


O 尽早 地 检测 缺陷 ， 在 它们 刚刚 出 现 的 时 候 就 修复 它们 。 
o 把 实现 无 缺陷 的 软件 当成 是 可 以 实现 的 目标 ， 依 此 而 行动 ， 但 是 既 要 追求 完美 又 要 追求 
实用 。 
O 如果 你 发 现 自己 面临 的 是 低 质 量 的 代码 库 ， 按 照 下 面 的 去 做 。 
a 要 认识 到 是 没有 灵丹妙药 的 。 
确保 基本 的 要 素 已 就 绪 。 
m 从 “不 干净 ”的 代码 中 将 “干净 ”的 代码 分 离 出 来 ， 并 让 它 始终 保持 干净 。 
m 使 用 缺陷 分 类 ， 以 保持 你 对 缺陷 数据 库 的 控制 。 
通过 添加 测试 和 进行 代码 重 构 来 逐渐 地 优化 质量 低下 的 代码 。 


(d 第 三 部 分 


深入 调试 技术 





第 8 章 特殊 案例 

第 9 章 理想 的 调试 环境 

第 10 章 ”让 软件 学 会 自己 寻找 缺陷 
Hie RAK 
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特殊 案例 


某 些 类 型 的 缺陷 受益 于 一 些 特殊 的 处 理 方法 。 在 这 一 章 中 ， 我 们 将 探讨 一 些 特殊 的 案例 。 


8.1 修补 已 经 发 布 的 软件 


所 有 运行 良好 的 软件 项 目 理所当然 都 会 有 一 个 发 布 时 间 规划 。 传统 的 项 目 可 能 要 求 每 半年 做 
一 次 , 敏捷 项 目 可 能 每 两 个 星期 做 一 次 , 但 是 这 些 项 目 都 要 发 布 在 明确 规定 的 、 有 计划 的 和 受 控 
制 的 时 间 点 上 。 


这 个 过 程 不 应 被 轻易 地 改变 。 然 而 ， 偶 尔 你 可 能 会 遇 到 一 个 十 分 严重 的 缺陷 ， 你 不 得 不 打破 
正常 的 时 间 规划 来 修补 已 经 发 布 的 软件 。 


— p neuki binon 诊断 这 种 缺陷 与 诊断 其 他 缺陷 没有 什么 不 同 。 而 当 你 
B, SLPTHARTRR. 开始 准备 设计 修复 程序 时 ， 事 情 就 会 不 一 样 起 来 。 因 为 设 

When patching an existing ” 计 修 补 程序 的 目标 与 正常 的 目标 有 所 不 同 。 你 的 主要 目标 
release, concentrate on reducing ”通常 是 要 修复 错误 的 根源 ， 而 对 已 经 发 布 的 软件 进行 修补 
risk. 时 ， 它 只 是 在 最 大 程度 地 降低 风险 。 


一 个 真正 的 修复 可 能 涉及 大 范围 的 软件 重 构 ， 甚 至 是 深层 次 的 软件 体系 结构 的 变化 。 在 缺少 
对 整个 发 布 过 程 的 正常 检验 和 各 环节 平衡 的 前 提 下 , 很 难 确定 这 些 变化 将 不 会 带 来 连锁 反应 ， 最 
终 使 事情 变 得 更 精 而 不 是 更 好 。 

因此 ， 当 实施 一 个 补丁 的 时 候 ， 治 标 不 治本 的 方法 有 时 候 可 能 是 一 个 更 好 的 选择 。 这 是 一 个 
很 难 达 到 的 平衡 ， 你 通常 要 避免 “掩盖 错误 ”。 

如 果 你 确实 决定 采取 这 种 方法 ， 那 么 不 要 认为 ， 因 为 修复 程序 是 一 次 “修改 ”"， 你 就 可 以 缴 
忽 大 意 。 与 此 相反 ， 你 需要 更 加 地 注意 ， 阻 止 一 些 潜在 的 问题 与 这 样 的 修复 产生 关联 。 虽 然 你 不 
能 像 正常 情况 下 对 一 个 完整 发 布 程序 进行 所 有 检查 ， 但 是 应 该 进行 尽 可 能 多 的 检查 。 这 个 时 候 ， 
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你 能 充分 享受 自己 在 自动 化 测试 和 发 布 过 程 中 付出 的 努力 。 


除了 修补 当前 版 本 ， 你 还 需要 修复 开发 版 中 相同 的 缺 
陷 。 你 不 希望 未 来 的 某 一 时 刻 有 人 使 用 补丁 版 去 升级 软件 ， ` 

然后 突然 发 现 打 补 丁 解决 的 问题 又 回来 了 。 但 是 , 不 要 盲目 The bug will need fining in 
地 作出 同样 的 修改 一 一 开发 版 将 经 历 完整 的 发 布 周期 ， 因 “the development version too. 
此 ， 应 该 得 到 一 个 完善 的 、 能 够 解决 根本 症结 的 修复 。 我 们 将 在 9.2 节 中 讨论 让 你 的 源 代码 控制 
系统 帮助 你 解决 这 个 问题 。 


不 幸 的 是 ， 打 补丁 的 时 候 进 行 了 一 个 修复 ,在 随后 的 版 本 中 又 作 了 另 一 个 修复 ， 这 样 会 导致 
不 同 版 本 之 间 出 现 不 兼容 的 行为 一 一 一 个 我 们 即将 讨论 的 问题 。 


8.2 MARE 


表面 看 来 ， 定 位 一 个 缺陷 是 一 个 明确 的 过 程 。 应 该 是 这 样 的 ， 但 实际 上 ， 只 是 找到 发 生 缺 陷 
的 原因 然后 修复 缺陷 。 


许多 缺陷 确实 一 眼 就 能 看 穿 。 但 是 ， 有 时 如 果 缺 陷 出 现在 用 户 已 经 使 用 的 软件 中 ,你 可 能 需 
要 考虑 向 后 兼容 的 问题 了 。 


问题 是 , 如果 用 户 已 经 使 用 了 一 段 时 间 包 含 缺陷 的 软件 版 本 , 那么 他 们 可 能 依靠 它 在 做 一 些 
错误 的 事 。 如 果 不 考虑 后 果 而 对 其 进行 修复 ， 你 很 可 能 会 车 恼 很 多 用 户 。 


当然 ， 没 有 人 会 故意 地 去 依赖 这 种 不 良 的 行为 。 不幸 的 是 ， 很 容易 就 突然 地 结束 对 它 的 依 
Hi. 


O 如 果 缺 陷 影响 到 应 用 程序 保存 的 文件 ， 也 许 用 户 已 经 逐渐 累积 了 大 量 损坏 的 文件 ? 当 在 
后 来 的 升级 版 本 中 打开 的 时 候 , 文件 是 不 是 可 能 不 会 给 出 期 望 的 结果 ? 或 者 更 精 的 是 , 根 
本 就 打 不 开 呢 ? 

如 果 缺 陷 影响 你 的 API, 那么 当 遇 到 一 个 修复 版 本 的 时 候 , 任何 与 你 的 应 用 程序 交互 的 代 
码 都 可 能 失败 。 

o 影响 用 户 界 面 的 修复 可 能 会 导致 用 户 不 得 不 重新 学 习 如 何 操作 软件 〈 要 付出 相关 的 再 培 
训 费 用 )。 
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D 也 许 ， 要 除去 那些 想 利 用 软件 漏洞 来 实现 不 可 告 人 目的 的 人 。 
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W 小 乔 爱问 
X ”如果 我 需要 一 直 修补 现 有 版 本 该 怎么 办 呢 


修补 现 有 的 版 本 只 适合 某 些 特殊 情况 。 如 果 它 成 为 常规 的 事物 ， 那 么 你 就 有 大 麻烦 了 。 


发 布 补丁 是 昂贵 的 、 危 险 的 、 浪 费时 间 的 。 持 续 地 这 么 做 会 导致 程序 很 不 稳定 ， 也 会 使 
你 深 陷 泥 潭 。 不 要 坚持 一 个 不 完整 的 进程 ， 需 要 花 曲 时 间 来 确定 潜在 的 原因 并 修复 错误 。 


口 也 许 是 不 同 版 本 之 间 的 间隔 太 长 ? 考虑 转向 一 个 更 加 敏捷 的 过 程 ， 这 样 可 以 让 你 频 


繁 地 发 布 产品 ， 或 者 创建 一 个 维护 计划 将 结构 引入 到 维护 版 本 中 。 


D 你 是 否 有 客户 还 “迷恋 "着 旧版 本 ? 你 能 做 些 什么 让 他 们 也 升级 吗 ? 或 许 你 需要 使 逢 
级 过 程 更 加 容易 或 更 加 可 信 ? 或 去 掉 政 治 限制 〈 例 如 无 效 升级 的 费用 ) ? 或 者 在 2.0 
版 本 中 重新 使 用 那些 失去 的 重要 功能 ,因为 这 些 功能 是 导致 它们 坚持 使 用 1.4 版 本 的 
原因 ? 


口 你 的 问题 只 是 简单 地 努力 处 理 大 量 的 缺陷 吗 ? 如 果 是 这 样 ， 应 该 考虑 采用 我 们 在 7.3 
节 中 讨论 的 方法 。 





8.2.1 确定 你 的 代码 有 问题 


你 首先 要 做 的 就 是 确定 你 正在 进行 的 修复 工作 是 否 可 能 引起 兼容 性 问题 。 不 幸 的 是 ,这 可 能 
会 非常 难 办 ， 用 户 可 能 会 依靠 各 种 各 样 的 细微 因素 ， 对 它们 进行 预测 是 很 难 的 。 


直接 间 他 们 是 很 难 取得 成 效 的 ,这 种 依赖 关系 几乎 总 是 偶然 的 ， 因此， 他 们 是 不 会 有 什么 印 
象 的 。 
— RAEE AEpAA 你 主要 能 做 的 就 只 是 在 你 对 整体 了 解 的 基础 上 思考 一 
你 间 缺 了 修复 检查 列表 中 。 下 你 的 修改 是 否 会 引起 任何 兼容 性 问题 。 为 此 ， 将 它 作为 
Add identifying compatibility ”你 的 缺陷 修复 检查 单 上 的 一 项 是 很 有 意义 的 ， 这 样 可 以 确 
_issues to your bug- fixing checklist» 保 你 不 会 忘记 它 。 


你 的 回归 测试 套件 可 以 帮助 查 明 向 后 兼容 性 问题 不幸 的 是 ,手工 建造 的 测试 往往 是 简单 的 ， 
运行 简单 的 用 例 ， 相 反 ， 我 们 想 要 查 明 的 问题 是 松散 结合 的 软件 区 域 间 的 复杂 交互 。 所 以 ,建立 
一 个 “真实 世界 ”实例 库 是 一 个 非常 好 的 选择 。 你 的 实例 库 的 范围 越 丰富 ， 你 就 越 容易 在 投入 真 
实 世界 前 找 出 问题 。 
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8.2.2 解决 兼容 性 问题 


一 旦 你 已 经 确定 修复 工作 可 能 导致 兼容 性 问题 ， 那 么 你 能 做 些 什么 ? 


你 希望 在 两 个 潜在 的 相互 冲突 的 目标 之 间 找 到 一 个 平衡 。 一 方面 , 针对 问题 进行 高 质量 的 修 
复 。 另 一 方面 ， 要 尽量 减少 因 缺 乏 向 后 兼容 性 而 引起 的 问题 。 不 幸 的 是 ， 同 时 实现 这 两 个 目标 是 
不 可 能 的 一 一 你 可 能 最 终 会 寻找 一 个 最 好 的 折 圳 方案 。 


你 可 以 有 很 多 选择 。 
1. 提供 迁移 的 方法 


给 用 户 提供 一 些 方法 来 修改 其 现 有 的 数据 、 代 码 等 东西 ， 以 适应 新 的 规则 ， 例 如 ， 一 种 转换 
现 有 的 文件 的 实用 工具 ， 以 便 用 户 能 够 正确 地 使 用 新 的 软件 。 


有 可 能 将 这 个 过 程 自动 化 , 以 便 在 安装 过 程 中 数据 可 以 自动 升级 。 但 要 确保 对 其 进行 了 认真 
的 测试 并 且 进 行 了 备份 一 如 果 升 级 失败 并 在 升级 过 程 中 将 所 有 数据 都 毁 掉 , 你 的 用 户 决 不 会 感 
谢 你 。 

2. 实现 一 个 兼容 模式 


或 者 你 可 以 提供 一 个 既 包含 新 代码 又 包含 旧 代 码 的 版 本 ,以 及 它们 之 间 的 转换 方法 。 用 户 
可 以 开始 使 用 兼容 模式 ， 它 运行 的 是 旧 代 码 ， 当 他 们 迁移 之 后 再 切换 到 新 代码 。 理 想 情况 下 这 
个 转换 是 自动 的 一 一 例如 ， 当 软件 检测 到 旧 的 文件 。 


微软 的 Word 是 使 用 这 种 方法 的 一 个 很 好 的 例子 。 当 打开 一 个 旧 文 件 (扩展 名 为 .doc)， 它 会 
以 兼容 模式 运行 ( 见 图 8-1) 。 以 新 的 格式 保存 文件 〈.docx) ， 则 Word 的 行为 以 及 你 的 文档 布局 
可 能 也 改变 了 。 


bod E ie 





8-1 微软 Word 的 兼容 模式 
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TT EFRA ARRA 这 不 是 一 个 能 被 轻易 采用 的 解决 办 法 。 无 论 对 你 还 是 
Burk. 你 的 用 户 来 说 ， 它 的 成 本 都 非常 高 。 从 你 的 角度 来 看 ， 兼 
A compatibility mode is an 容 模式 对 代码 的 质量 没有 任何 贡献 。 从 用 户 的 角度 来 看 ， 
_ezzenstye solutions 兼容 模式 很 仿 人 困惑 一 他 们 需要 了 解 软 件 支持 两 种 不 同 
的 行为 ， 它 们 的 不 同 之 处 是 什么 ,什么 时 候 用 哪 一 种 模式 。 只 有 付出 的 成 本 合理 时 才 会 使 用 这 种 
模式 。 
如 果 你 够 幸运 ， 你 仅仅 需要 支持 兼容 代码 一 段 有 限 的 时 间 (可 能 一 个 或 两 个 版 本 ) ， 让 你 的 
用 户 在 这 段 充 裕 的 时 间 内 进行 迁移 。 在 此 之 后 ,你 可 以 再 次 清理 代码 。 理 论 上 是 完美 的 , 但 这 些 
事情 有 一 个 “粘性 ”的 习惯 一 一 只 有 当 你 成 功 地 说 服用 户 进行 迁移 时 ，, 才 可 以 清除 你 的 兼容 性 代 
码 。 当 一 切 工作 正常 的 时 候 ， 他 们 为 什么 会 迁移 呢 ? 


3. 提供 预警 


如 果 你 知道 将 不 得 不 作出 重大 的 修改 ,但 是 不 必 立即 作出 修改 ,就 可 以 提供 预警 给 你 的 用 户 ， 
告诉 他 们 最 终 需要 进行 迁移 。 例 如 ， 当 Sun 公司 对 现 有 Java API 不 满意 的 时 候 就 经 常 这 么 做 。 


当然 , 只 有 当 你 能 长 时 间 延 长 修复 以 使 你 的 用 户 能 够 迁移 一 并且 知道 用 户 是 否 真 的 迁移 的 
情况 下 才能 有 效 。 


4. 不 修复 缺陷 


最 后 的 选择 是 把 缺陷 留 在 那里 一 一 修复 相关 的 兼容 性 问题 带 来 的 代价 可 能 比 修复 它 带 来 的 
好 处 要 大 得 多 。 


这 不 是 一 个 好 的 解决 方案 ， 但 是 极 少数 情况 下 它 也许 是 一 个 务实 的 选择 。 
这 不 只 是 你 需要 担心 的 缺陷 


PostScript 是 一 种 页 面 描 述 语 言 , 被 用 来 控制 打印 机 (手段 之 一 )。 该 语言 是 由 Adobe 
开发 的 ， 但 很 多 第 三 方 公司 有 自己 的 实现 。20 世纪 90 年 代 初 ， 我 就 在 这 样 一 个 公司 工 
作 。 


当时 有 一 个 测试 套件 应 用 得 非常 广泛 , 包括 数 千 个 参考 页 面 ， 占 用 了 数 米 的 书架 空 
间 。” 
问题 是 这 些 参考 页 面 都 必须 由 真实 的 实现 程序 〈 在 这 个 例子 中 是 Adobe 的 ) ÆR, 


@ 有 一 天 搓 板 支撑 崩 渍 了 ， 桌 子 上 的 书架 几乎 要 了 我 的 命 ! 
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而 且 ， 像 任何 大 的 软件 系统 一 样 ， 偶 尔 也 会 出 现 缺 陷 。 所 以 ， 在 我 们 的 软件 生成 的 页 面 
和 测试 套件 生成 的 页 面 之 间 存 在 差异 ， 有 时 这 并 不 是 我 们 的 错 。 


从 理论 上 说 是 这 样 的 。 
打印 机 的 目的 是 打印 出 产品 。 客 户 对 于 为 什么 他 们 的 页 面 不 符合 他 们 期 望 的 芹 学 争 
论 并 不 感 兴趣 一 一 在 那 台 打印 机 上 打印 得 很 好 , 那么 为 什么 在 装 有 你 们 软件 的 打印 机 上 


打印 却 会 出 错 ? 因 此 在 一 些 情况 下 我 们 确定 , 务实 的 做 法 是 仿效 参考 实现 中 的 缺陷 。 这 
也 许 并 不 完美 ,但 是 有 时 这 就 是 世界 的 运作 方式 。 


8.3 并 发 


并 发 软件 是 难以 重 现 、 难 以 诊断 以 及 难以 修复 的 主要 问题 来 源 。 这 些 软件 中 的 缺陷 具有 很 大 
的 不 确定 性 , 它们 之 间 存 在 着 微妙 的 并 且 难 以 理解 的 相互 作用 , 并 且 受 很 多 不 明 原因 的 失效 模式 
影响 。 


8.3.1 简单 与 控制 


可 以 在 并 发 软件 中 添加 很 多 东西 帮 你 调试 。 两 个 关键 的 要 素 就 是 简单 和 控制 。 


简单 是 任何 软件 设计 的 关键 要 素 之 一 , 但 是 它 在 处 理 并 发 问题 时 尤为 重要 。 保 持 独立 线程 的 
直接 相互 作用 , 尽 可 能 将 它们 限制 在 一 些小 的 代码 区 内 ,你 可 能 会 惊奇 地 发 现 可 以 让 它们 之 间 的 
相互 作用 如 此 简单 。 


最 简单 的 代码 也 可 能 正常 工作 


我 们 正在 设计 一 个 服务 器 ， 在 最 终 的 配置 时 ,将 要 处 理 成 千 上 万 的 并 发 请 求 。 这 些 
线程 需要 共享 数据 ， 并 发 地 访问 和 修改 它 。 


共享 的 数据 采用 了 树 形 结构 , 我 们 讨论 了 很 长 时 间 关 于 提供 安全 并 发 访问 的 各 种 方 
法 的 优点 。 我 们 制定 了 宏大 计划 ， 不同 的 子 树 可 以 锁定 方便 读 取 或 写 入 ， 以 及 当 线 程 间 
时 需要 多 个 同步 锁 的 时 候 如 何 避 免 死 锁 带 来 的 风险 。 这 都 是 非常 聪明 的 方法 ， 但 是 有 必 
要 吗 ? 

最 后 ， 我 们 创建 了 一 个 能 模拟 成 千 上 万 的 用 户 访问 服务 器 并 进行 负载 测试 的 工具 。 
结果 发 现 ， 一 个 “多 读 取 者 ， 单 写 入 者 ”的 锁定 模式 比 我 们 设想 的 访问 方式 要 好 得 多 。 
这 大 大 地 简化 了 程序 一 一 你 也 不 会 因为 使 用 单个 锁 而 产生 死 锁 。 
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一 个 简单 的 设计 不 仅 可 以 使 你 的 软件 更 容易 理解 , 并且 从 一 开始 就 会 减少 缺陷 的 产生 , 而 且 
也 更 容易 控制 一 一 尤其 是 当 你 试 着 用 并 发 软件 重 现 问 题 的 时 候 。 如 果 线 程 只 在 少数 明确 定义 的 方 
法 和 少数 明确 定义 的 地 方才 会 互相 作用 , 那么 就 更 容易 确保 在 调试 期 间 它 们 会 以 你 想 要 的 方式 去 
相互 作用 。 


并 发 软件 中 的 大 多 数 缺陷 都 会 看 上 去 非常 “正常 ”并 且 与 并 发 没有 任何 关系 。 但 是 在 诊断 期 
间 必 须 处 理 多 线程 可 能 会 使 问题 变 得 相当 地 复杂 。 因 此 , 构建 能 够 没有 任何 并 发 的 运行 软件 的 选 
项 是 非常 有 帮助 的 一 一 要 么 将 其 限制 为 单线 程 运 行 , 要 么 使 多 个 线程 按照 定义 好 的 顺序 串 行 运行 
(取代 随意 的 上 下 文 切换 )。 


只 有 上 下 文 切换 发 生 在 特定 的 地 方 和 特定 的 时 间 时 ， 大 多 数 与 软件 并 发 有 关 的 缺陷 才能 重 
现 。 可 靠 地 进行 缺陷 重 现 取决 于 精确 控制 这 些 上 下 文 切换 发 生 的 时 间 。 正 如 我 们 在 2.5 节 所 看 到 
的 ， 有 时 你 可 以 明智 地 使 用 sleepQ 〇 方法 来 达到 这 个 目的 , 但 是 如 果 能 够 在 同步 代码 中 生成 对 于 
程序 运行 顺序 的 控制 能 力 就 更 好 了 。 


8.3.2 修复 并 发 缺陷 


当 你 要 修复 并 发 软件 中 产生 的 缺陷 的 时 候 , 要 记 住 一 个 关键 的 要 素 一 一 让 它们 尽 可 能 少 地 发 
生 不 是 可 取 的 修复 办 法 。 


通常 你 会 发 现 有 一 个 具体 的 “窗口 "， 在 这 个 窗口 可 能 出 现 竞 争 状态 。 看 到 如 何 使 窗口 变 小 
可 能 很 容易 ， 但 是 要 看 见 它 如 何 完全 关闭 就 并 不 那么 容易 了 。 


例如 ,你 可 能 在 几乎 同一 时 间 启 动 许多 线程 ， 如 果 发 现 它们 的 初始 化 代码 是 同时 在 运行 那 
么 你 的 程序 一 定 有 问题 。 假 设 当 第 二 个 线程 启动 的 时 候 ， 第 一 个 线程 已 经 完成 了 它 的 初始 化 , 一 
个 易 理 解 的 但 是 不 正确 的 修复 就 是 推迟 启动 多 个 线程 。 


任何 这 种 类 型 修复 的 问题 在 于 ， 如 果 这 样 的 窗口 没有 完全 关闭 , 早晚 都 会 出 问题 。 除 非 是 在 
一 些 特殊 情况 下 (也 许 是 在 系统 负载 很 大 ， 运 行 速度 比 正常 情况 下 慢 很 多 的 时 候 )。 你 所 做 的 一 
切 只 是 使 它 在 下 一 次 更 难 重 现 和 跟踪 。 


— pirane, bah 尤其 是 sleep 〇 几乎 从 来 就 不 是 正确 的 解决 方法 。 我 
使 用 sleepOSiHte 们 已 经 讨论 过 ， 它 可 以 作为 一 种 极其 有 用 的 手段 ， 强 迫 缺 
Avoid using sleep) when fiaing ” 陷 可 靠 地 重 现 ， 或 测试 一 种 关于 软件 如 何 运行 的 理论 ， 但 
Concurrency bugs。 o 是 对 于 修复 并 发 缺陷 来 说 它 不 是 合适 的 工具 。 把 它 当 作 并 
发 编程 中 的 goto 语句 一 一 如 果 你 发 现 自己 在 考虑 这 个 问题 ， 那 么 这 是 严重 的 警告 了 。 


8.4 RERE A 97 


8.4 海 森 堡 缺陷 


海 森 堡 缺陷 ,一 个 当 你 开始 寻找 的 时 候 就 会 “消失 ”的 缺陷 ， 其 名 字 来 自 于 量子 力学 中 的 海 
森 堡 不 确定 理论 ， 这 个 理论 (不 严格 地 说 ) 指出 在 观察 某 一 系统 的 过 程 中 行为 不 可 能 不 发 生 改 
变 "。 典 型 的 海 森 堡 缺 陷 确实 可 以 重 现 ， 但 是 当 你 找寻 它们 的 时 候 ， 它 们 就 会 隐藏 起 来 。 这 会 使 
缺陷 诊断 非常 令 人 诅 表 。 


问题 是 , 所 有 能 够 供 你 检查 软件 行为 的 技术 都 会 在 一 定 程度 上 影响 其 行为 。 不 管 你 是 通过 直 
接 在 代码 中 进行 插 桩 , 还 是 在 一 个 调试 器 下 运行 它 来 获得 你 所 需要 的 信息 ,都 几乎 肯定 会 改变 它 
的 时 序 ， 它 在 内 存 中 的 布局 ， 甚 至 两 者 都 会 改变 。 


对 于 大 多 数 的 缺陷 ， 这 不 是 问题 , 但 海 森 堡 缺陷 依赖 于 软件 某 些 不 确定 性 的 因素 。 这 本 身 可 
以 成 为 一 个 有 用 的 线索 。 回 顾 2.5 节 ， 导 致 不 确定 性 产生 的 原因 是 非常 有 限 的 ， 所 以 遇 到 海 森 保 
缺陷 就 意味 着 这 个 缺陷 一 定 会 被 这 些 原因 中 的 一 个 所 影响 。 

你 应 该 进行 的 最 快 最 容易 的 尝试 是 从 一 个 收集 信息 的 方法 转换 到 另 一 个 方法 。 如 果 你 在 调试 


器 下 运行 软件 ,那么 尝试 将 插 桩 直接 加 到 源 代码 中 ,反之 亦 然 。 使 用 调试 器 的 效果 和 将 插 桩 直接 
加 到 源 代码 中 的 效果 是 不 同 的 ， 而 这 种 差异 可 能 就 是 你 所 需要 的 。 


如 果 你 不 是 很 幸运 ， 那 么 你 的 任务 就 要 变 成 找到 某 种 
方法 来 收集 你 所 需要 的 信息 ,这 种 方法 对 软件 的 影响 极 小 ， g CERT RAG ERAS 
保证 不 会 改变 它 的 行为 。 Minimize the side effects 


日 志 记 录 是 改变 时 序 的 一 个 主要 原因 一 一 例如 ， 调 用 rondo aii 
System.out.print1nO 〇 方法 , 需要 花费 成 千 上 万 的 时 钟 周 LEE 
期 ， 可 能 至 少 涉及 一 次 环境 切换 。 

你 可 以 利用 对 不 确定 性 区 域 的 理解 ,来 避免 影响 这 些 区 域 。 例 如 ， 如 果 该 代码 包含 一 个 紧密 
循环 ， 它 与 另 -一 个 线程 相互 作用 ， 对 于 循环 的 时 序 影响 很 有 可 能 会 改变 其 行为 。 删 除 任何 添加 到 
循环 中 的 插 桩 程序 ， 看 看 缺陷 是 否 暴 露出 来 了 。 如 果 暴 露出 来 , 再 看 看 是 否 可 以 找到 一 种 不 用 过 
多 影响 时 序 的 方法 来 收集 你 所 需要 的 资料 。 

内 存 中 的 日 志 

几 年 前 我 曾 研发 过 一 个 大 型 的 多 线程 产品 , 我 发 现 自己 要 追查 一 个 特别 不 易 捕捉 到 

的 海 森 堡 缺陷 。 我们 有 充足 的 日 志文 件 遍布 在 整个 代码 中 ,并 在 诊断 线程 间 步 问题 时 多 








O 这 可 能 更 多 地 被 作为 观察 者 效应 而 为 人 熟知 一 海 森 保 不 确定 性 原理 实际 上 涉及 我 们 可 以 执行 量子 力学 系统 的 准 
确 性 。 但 这 是 一 个 可 爱 的 名 字 ， 所 以 不 要 太守 旧 。 
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次 体现 了 它 的 价值 。 不 幸 的 是 ， 每 当 我 打开 日 志 功 能 时 ， 代 码 就 表现 得 完美 无 缺 。 


我 不 想 失 去 日 志 功 能 ， 因 为 我 敢 肯 定 ， 它 会 告诉 我 想 知道 的 。 要 是 我 能 找到 一 种 方 
法 减少 它 对 代码 执行 的 影响 就 好 了 。 


解决 的 办 法 是 重新 实现 日 志 函 数 , 而 不 是 使 用 通常 的 输出 函数 ,他 们 将 日 志 写 入 内 
存 中 的 缓冲 区 (每 一 个 线程 写 一 个 ， 因 此 我 不 必 担 心 同步 访问 共享 缓冲 区 的 问题 )。 这 
些 缓冲 区 会 在 代码 的 敏感 部 分 执行 完毕 后 输出 ， 随 后 进行 交叉 存 取 (以 保证 日 志 信息 以 
正确 的 顺序 输出 )。 


虽然 新 的 记录 功能 仍 会 明显 产生 一 些 影响 , 但 事实 证 明 产 生 的 影响 是 极 小 的 ,可 以 
使 问题 重 现 了 。 正 如 我 希望 的 那样 ， 输 出 信息 准确 地 给 出 了 我 所 需要 的 内 容 ， 能 够 确定 
问题 发 生 的 原因 。 


W 小 乔 爱问 
Y 我 怎么 能 肯定 已 经 修复 了 海 森 堡 缺 陷 呢 

事实 上 ， 海 森 堡 缺 陷 似乎 像 “ 类 那 猫 ” 那 样 容易 FoSAMA) 地 时 隐 时 现 ， 因 此 确 
定 你 是 否 真 的 修复 了 一 个 海 森 堡 缺陷 是 非常 困难 的 。 如 果 仅仅 通过 在 调试 器 下 运行 软件 或 
添加 一 个 单行 的 输出 语句 就 能 说 续 隐 “没有 了 ”， 谁 能 说 你 修复 的 结果 不 是 一 个 时 有 了 时 无 
的 行为 呢 ? 


唯一 的 解决 办 法 是 要 比 平时 更 仔细 一 些 , 要 确保 你 真正 地 了 解 潜藏 的 根本 原因 。 无论 
有 什么 样 的 疑问 ， 宁 可 说 慎 不 可 鸡 忽 ， 要 假设 你 还 没 了 解 问题 的 本 质 ， 不 要 假设 你 已 经 修 


复 它 了 。 

例如 ， 你 确定 该 缺陷 是 因为 一 个 未 初始 化 的 变量 产生 的 ， 并 通过 将 其 初始 化 为 NULL 对 
它 进 行 了 修复 。 不 要 停 在 这 里 ， 准 确 地 再 明白 ， 没 有 初始 化 的 变量 是 如 何 引起 你 所 观察 到 的 
行为 的 。 它 曾经 取 过 这 个 值 吗 ? 如 果 你 明确 地 将 其 初始 化 为 这 个 “ 坏 ” 的 值 ， 你 看 到 了 你 期 
望 看 到 的 结果 了 吗 ? 





8.5 ”性 能 缺陷 


Donald Knuth 的 著名 论断 “过 早 的 优化 是 所 有 罪恶 的 根源 ”" 应 该 深 深 锡 刻 在 每 一 个 专业 软 
件 工程 师 的 脑海 里 。 不 管 不 顾 地 单纯 追求 效率 比 其 他 任何 原因 产生 的 不 良 代码 都 多 。 


© 448 Structured Programming with go to Statements [Knu74]。 
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但 是 ， 这 并 不 意味 着 可 以 忽视 效率 。 如 果 你 的 软件 花 了 10 分 钟 去 执行 一 个 本 应 10 秒 钟 就 完 
成 的 任务 ， 那 么 可 以 肯定 你 的 软件 有 问题 。 


8.5.1 寻找 瓶颈 


如 同 任 何 种 类 的 缺陷 ， 解决 性 能 问题 的 关键 是 确定 问题 产生 的 根本 原因 。 十 之 八 九 ,这 意味 
着 你 将 去 寻找 靖 颈 一 一 代码 的 某 个 特定 区 限制 了 整体 性 能 。 


在 大 多 数 软件 中 , 往往 极 少数 的 代码 占用 了 大 部 分 的 执行 时 间 。 你 的 首要 任务 是 确定 软件 的 
哪个 部 分 耗费 了 所 有 的 时 间 。 这 样 做 可 以 找到 占用 大 量 时 间 的 原因 。 


基于 这 个 原因 , CREE ATL. “一 相机 和 和 全 人 
具 都 有 效 一 性 能 分 析 器 。 代码 进行 性 能 分 析 。 


性 能 分 析 器 多 种 多 样 ， 各 工具 在 工作 方式 的 细节 ( 例 E O Se 
diagnosing a performance bug. 
如 ， 有 些 需 要 编译 环境 中 有 特定 的 钩子 函数 ， 而 有 些 则 影 一 全 
响 未 修改 的 代码 ) 和 产生 细节 信息 的 数量 上 有 所 不 同 。 它 们 的 共同 特点 是 ， 在 代码 运行 时 ， 它 们 
会 检查 代码 来 生成 一 个 报告 (或 分 析 文档 ) ， 说 明 在 程序 的 哪 部 分 花费 了 大 部 分 时 间 。 这 是 极为 
珍贵 的 数据 一 一 当 你 追踪 到 几 个 性 能 缺陷 后 , 就 会 很 快 发 现 通过 检查 代码 来 预测 性 能 瓶颈 几乎 是 
不 可 能 的 。 唯 一 确定 的 解决 方法 就 是 按照 从 运行 的 软件 中 收集 的 数据 运行 。 


因此 ， 你 的 主要 关注 点 是 保证 生成 的 性 能 分 析 文 档 能 够 准确 地 反映 软件 的 真实 行为 。 


8.5.2 ”准确 的 性 能 分 析 


适用 于 性 能 分 析 的 观察 者 效应 (Observer Effect) 和 其 他 任何 观察 代码 的 方法 一 样 一 一 至 少 
在 理论 上 , 你 观察 性 能 的 行为 会 影响 你 正在 检查 的 程序 。 正 是 认识 到 这 一 点 , 这 类 工具 的 编写 者 
都 投入 了 大 量 的 努力 ， 以 确保 它们 对 分 析 的 软件 的 影响 尽 可 能 地 小 。 因 此 ， 在 大 多 数 情况 下 ， 你 
不 必 担心 性 能 分 析 器 本 身影 响 你 的 调查 结果 。 
更 有 可 能 对 你 的 结果 质量 产生 不 利 影 响 的 是 如 何 构建 和 运行 你 的 软件 。 你 需要 明确 以 下 的 事 
情 。 
O 你 要 分 析 的 构建 应 该 尽 可 能 地 接近 产品 版 本 。 特 别 是 ， 请 确保 你 以 同样 优化 的 水 平 来 构 
建 它 。 
Q 你 的 运行 环境 要 尽 可 能 地 与 软件 的 最 终 目 标 运 行 环境 相同 。 用 于 开发 软件 的 机 器 可 能 也 
可 能 不 符合 要 求 ， 这 取决 于 软件 的 类 型 。 
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O 请 你 使 用 具有 代表 性 的 数据 运行 软件 。 例 如 ， 使 用 小 的 数据 集 往往 更 有 吸引 力 ， 因 为 它 
们 比 真实 的 产品 数据 更 方便 , 但 这 可 能 会 生成 误导 性 的 分 析 文件 (可 能 会 过 分 强调 产生 重 
定 开销 的 任务 的 影响 ， 或 者 没 能 表现 出 缓存 或 分 页 机 制 的 效果 )。 


有 时， 并 不 存在 一 个 或 几 个 痢 颈 ， 而 是 软件 总 体 运行 者 很 慢 ， 或 者 在 某 个 不 定 的 时 间 不 
定 的 地 方 慢 下 来 。 在 这 种 情况 下 ,你 需要 通盘 地 寻找 哪些 因素 可 以 影响 到 软件 的 性 能 。 主 要 
的 可 能 原因 包括 以 下 几 点 。 


资源 耗 尽 为 了 满足 软件 的 内 存 需 求 操作 系统 必须 分 页 吗 ? 你 有 内 存 或 其 他 资源 泄漏 
的 问题 吗 ? ARE ASA ARH PA Sh? 


垃圾 收集 do R ARGH AE CAR F ALA AAA HR, IGOR BT ERRAL AT 


缓存 fo RA GRA RRM ERA AMIRA (内 存 、 磁 盘 或 其 他 ) ， 你 遇 到 大 量 
it AE KH T? 





8.6 RARE 


PARRA RAE RE, DEA EHS (尽管 它 可 以 是 )， 而 是 因为 它 所 在 的 
运行 环境 。 嵌入 式 系统 通常 运行 在 硬件 上 ， 这 与 你 的 开发 环境 有 很 大 的 差异 ,这些 硬件 的 性 能 和 
设施 都 很 有 限 ， 这 可 能 造成 访问 必要 的 用 来 高 效 调 试 的 信息 非常 地 困难 。 


8.6.1 RATA 


- 些 专门 的 工具 会 很 有 帮助 。 


仿真 ”仿真 器 和 模拟 器 在 精密 程度 和 它们 运行 的 确切 细节 上 是 不 同 的 〈 例 如 ， 有 的 运行 二 
进 制 代码 就 好 像 运 行 在 目标 硬件 上 一 样 ， 而 有 的 则 需要 构建 一 个 稍微 不 同 的 版 本 ) ， 但 它们 都 具 
有 相同 的 目标 一 一 允许 你 在 开发 机 上 运行 和 调试 软件 ， 而 不 必 使 用 目标 硬件 。 通 过 简化 和 缩短 编 
辑 / 构 建 /测试 的 周期 ， 它 们 可 以 为 你 节省 大 量 的 时 间 和 精力 。 此 外 ， 它 们 提供 增强 的 访问 功能 ， 
可 获得 很 难 从 产品 硬件 中 获取 的 信息 。 
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W 小 乔 爱问 
2 “如何 检测 性 能 回归 模型 


性 能 回归 可 以 很 容易 地 渗入 到 软件 中 一 一 正如 我 们 已 经 看 到 的 , 通过 观察 来 预测 软件 的 
性 能 是 十 分 困难 和 的， 预测 性 能 的 变化 同样 如 此 。 


因此 ,将 性 能 测试 纳入 到 你 的 回归 测试 赛 件 中 是 一 个 很 好 的 想法 。 例 如， 它们 可 以 运行 
在 具有 代表 性 的 大 数据 集 上 ， 如 果 花 费 的 时 间 超 出 可 以 接受 的 范围 就 发 出 报告 。 


如 果 程 序 运行 比 正常 情况 下 更 快 的 话 , 这 时 的 失败 测试 甚至 更 有 价值 。 做 出 一 个 本 不 应 
该 显著 影响 性 能 的 修改 后 , 一 个 测试 的 运行 速度 突然 变 为 原来 的 两 倍 ,这 也 可 以 说 明 存 在 问 
题 。 也 许 是 你 期 望 执行 的 一 些 代码 不 再 执行 了 ? 





远程 调试 ”许多 嵌入 式 系统 提供 了 远程 调试 支持 。 目 标 硬件 连接 到 开发 机 上 〈 通 过 电缆 、 
网 络 连接 或 类 似 的 方法 ) ， 调 试 器 运行 在 开发 机 上 并 控制 着 嵌入 式 系统 。 


开发 硬件 ”一 个 开发 电路 板 是 为 了 开发 而 设计 的 目标 硬件 版 本 。 它 有 附加 接口 和 可 能 支持 
测试 的 设备 , 例如 误差 仿真 。 开 发 硬件 的 主要 好 处 之 一 是 它 可 以 经 常 为 电路 内 模仿 器 提供 内 建 的 
支持 。 


W 小 乔 爱 问 
过 ” 它 是 一 个 硬件 问题 还 是 软件 向 题 


开发 谋 入 式 软件 的 挑战 之 一 是 软件 发 展 与 硬件 发 展 通常 是 并 行 的 。 但 是 有 一 种 不 好 的 趋 


势 是 ， 当 出 现 问 题 时 做 硬件 的 埋怨 做 软件 的 ， 做 软件 的 也 埋 扰 做 硬件 的 。 


无 论 对 与 锚 ， 通常 修复 一 个 硬件 问题 要 远 比 解决 软件 问题 更 难 。 因 此 ,无论 是 否 是 “你 
的 ”问题 ， 你 都 很 有 可 能 是 修复 它 的 那个 人 。 





电路 内 模仿 器 ”电路 内 模仿 器 (ICE) 是 一 个 多 少 有 点 过 时 的 术语 ， 但 一 般 来 说 ICE 是 一 个 
用 于 将 硬件 和 软件 结合 起 来 的 调试 器 , 以 提供 对 嵌入 式 系统 内 部 的 详细 访问 。 近 来 许多 系统 具有 
标准 的 JTAG 接口 ， 它 (包括 其 他 一 些 东西 ) 提供 了 一 -种 标准 的 手段 ， 可 以 获得 从 入 式 硬 件 的 调 
试 功能 。 


这 些 工 具 是 非常 宝贵 的 ， 但 它们 并 不 总 是 可 用 的 (可悲 的 是 ， 支 持 可 怜 的 软件 开发 人 员 
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往往 是 硬件 开发 人 员 最 后 才 要 做 的 ), 所 以 有 时 你 可 能 会 发 现 自己 不 得 不 面 对 原 始 的 或 不 存在 
的 调试 设备 。 有 时 候 ， 即 使 有 这 些 资料 ， 你 正在 追踪 的 缺陷 也 只 会 重 现在 产品 硬件 上 。 


8.6.2 ”提取 信息 的 痛苦 路 程 


鉴于 设备 有 限 , 直接 在 目标 硬件 上 调试 问题 的 主要 挑战 往往 是 访问 你 需要 的 信息 。 但是， 只 
要 有 一 点 想象 力 ， 你 通常 可 以 找到 某 种 方式 来 与 之 通信 。 


你 工作 的 系统 控制 了 某 些 东 西 。 你 可 以 把 这 种 控制 手段 当 作 通 信 的 渠道 也 许 你 可 以 使 用 一 
个 液晶 显示 屏 ? 或 者 是 允许 你 写 和 数据 的 一 个 串 行 端口? 

它 不 必 是 一 个 丰富 的 渠道 ， 一 个 就 足够 了 。 你 是 否 有 
一 个 可 用 的 LED? 或 者 你 可 以 启动 的 发 动机 ? 使 用 这 种 
方法 获得 信息 并 不 方便 ， 但 它 是 可 能 的 。 





One bit is enough. 





将 逻辑 分 析 仪 作为 软件 调试 工具 


我 在 开发 一 个 打印 机 驱动 程序 。 它 大 部 分 的 时 间 工 作 得 很 好 , 但 偶尔 也 会 输出 错误 
的 内 容 。 了 驱动 程序 的 代码 非常 简单 ， 只 是 把 一 个 位 图 文件 一 点 点 地 输送 给 打印 机 。 我 看 
不 出 数据 是 在 哪里 出 错 的 。 

最 后 ,我 们 判断 原因 可 能 是 时 间 问 题 , 也许 是 该 设备 的 驱动 程序 响应 中 汤 不 够 快 ? 
但 怎样 才 可 以 准确 测量 来 证 实 我 们 的 理论 呢 ? 

最 后 解决 方案 是 一 个 逻辑 分 析 仪 ， 一 个 显示 数字 电路 信号 的 硬件 调试 工具 。 我 修改 
了 设备 驱动 程序 ,以 提高 中 断 例 程 结束 时 一 个 未 使 用 的 接口 线 的 信号 ， 我 们 将 逻辑 分 析 
仪 连接 到 该 行 。 在 提出 中 断 时 通过 触发 分 析 仪 ， 我 们 可 以 准确 地 测量 遭 中 汤 与 成 功 被 处 
理 之 间 的 间隔 。 

果然 ,大 部 分 时 间 中 断 有 充裕 的 时 间 得 到 处 理 。 但 是 偶尔 ， 它 也 会 被 拖延 太 久 以 至 
出 错 。 通过 移动 设备 驱动 程序 提交 我 们 所 在 监测 信号 的 那个 点 , 我们 可 以 准确 地 查 明 究 
竟 在 何 处 发 生 延 误 。 

该 解决 方案 是 不 容易 的 ， 它 原来 是 操作 系统 的 虚拟 内 存 架 构 所 导致 的 ， 需 要 很 多 的 
努力 来 解决 。 但 至 少 我 们 知道 症结 所 在 了 。 


8.7 第 三 方 软件 的 缺陷 
独立 软件 的 时 代 早 已 过 去 了 。 现 代 软 件 必须 能 够 和 一 些 不 同 的 第 三 方 编写 的 代码 阵列 相 结 
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合 一 一 在 某 些 库 文件 和 框架 上 构建 ， 从 服务 器 接收 数据 ， 反 过 来 也 给 客户 端 提 供 数 据 。 


你 早晚 会 遇 到 不 是 你 编写 的 代码 中 出 现 缺 陷 的 问题 (或 看 似 是 )， 你 不 能 控制 它 ， 并 且 可 能 
没有 源 程序 。 处 理 这 种 缺陷 给 我 们 带 来 了 很 大 的 挑战 。 


8.7.1 不 要 太 快 去 指责 


第 三 方 的 代码 只 是 代码 。 而 且 ， 如 同 任何 代码 ， 它 也 会 包含 缺陷 。 所 以 ,很 可 能 你 要 追踪 的 
问题 不 是 你 自己 造成 的 。 
但 是 请 注意 一 不 要 那么 轻易 地 就 去 埋怨 别人 。 
大 部 分 和 你 打交道 的 第 三 方 代码 可 能 被 用 于 更 多 的 产品 或 有 更 多 的 人 在 使 用 。 这 意味 着 它 已 
经 受 很 好 的 测试 ， 大 部 分 比较 明显 的 缺陷 已 经 被 发 现 。 
3 个 月 一 事 无 成 
KK + MAP M 
我 们 团队 中 一 个 成 员 为 了 解决 一 个 缺陷 花费 了 3 个 多 月 的 全 职工 作 时 间 。 他 花 了 很 
多 时 间 试 图 理解 一 个 相当 复杂 的 第 三 方 库 文件 ， 最 后 一 事 无 成 。 
然后 他 的 同事 几乎 只 用 了 半天 很 偶然 地 就 修复 了 这 个 问题 一 一 他 应 该 使 用 受到 此 
缺陷 影响 的 功能 ， 并 注意 到 (对 这 个 特殊 的 案例 而 言 ) 库 文件 没有 被 正确 地 调用 。 
后 来 我 与 他 交谈 ,他 告诉 我 ， 他 所 做 的 就 是 假设 库 文件 基本 能 够 工作 ， 基 于 这 种 假 
设 他 研究 了 如 何 使 用 它 ， 答 案 一 下 子 就 时 出 来 了 。 他 说 ， 假 设 库 工作 是 相当 安全 的 ， 因 
为 这 个 代码 分 布地 十 分 广泛 ， 在 许多 地 方 都 被 使 用 。 
带 着 怀疑 的 眼光 对 待 你 自己 的 代码 。 首 先 假设 你 的 代 
码 是 有 缺陷 的 。 如 果 最 后 得 出 结论 缺陷 是 在 别 的 地 方 ， 那 CLUREALHERR, 
么 再 回来 努力 地 看 看 自己 的 代码 。 当 你 真 的 已 经 用 尽 了 所 pana ed ATS 
有 的 方法 之 后 ， 再 去 埋怨 第 三 方 代码 。 


8.7.2 处理 第 三 方 代码 的 缺陷 


如 果 你 已 经 发 现在 第 三 方 代码 中 存在 缺陷 ,就 需要 明白 该 怎么 处 置 它 。 除了 提交 报告 并 等 待 
编写 者 或 厂商 为 你 修复 这 个 缺陷 之 外 ， 你 可 能 别 无 选择 ， 但 是 你 可 以 找到 问题 的 解决 办 法 。 


或 者 ， 如 果 你 可 以 访问 源 代 码 ， 甚 至 可 以 自己 修复 它 。 但 是 ， 这 就 产生 了 一 个 问题 ， 你 是 否 
应 该 这 样 做 ? 
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报告 别人 代码 中 的 缺陷 


如 果 你 在 缺陷 报告 上 做 得 好 的 话 , 你 可 以 大 大 增加 修复 第 三 方 代码 缺陷 的 机 会 。 换 位 思 
考 一 下 , 仔细 起 想 你 会 希望 看 到 一 个 什么 样 的 缺陷 报告 。 确保 其 符合 6.1 节 中 所 描述 的 标准 。 


请 记 住 , 所 有 的 代码 都 有 夸 陷 。 毫 无 疑问 ， 当 你 花费 很 多 时 间 追 查 问题 的 时 候 可 能 会 很 
AR, 结果， 你 可 能 对 编写 者 没有 什么 好 感 。 在 沟通 中 不 要 表现 你 的 肖 谨 ,要 有 建设 性 ， 依 
据 事实 说 话 ， 这 样 更 容易 取得 进展 。 





如 果 可 以 的 话 ， 为 什么 不 自己 解决 问题 ? 缺陷 修复 应 该 是 要 解决 根本 原因 ， 不 是 吗 ? 


A 通常 情况 下 是 这 样 的 。 但 是 ， 第 三 方 代码 中 存在 的 缺 

ABLHAURBAE—T. 。 陷 不 属于 通常 的 情况 。 问 题 是 你 对 第 三 方 代码 所 进行 的 任 

Think carefully before 何 修改 ， 包 括 缺 陷 修复 ， 都 与 别人 要 解决 的 并 不 一 样 。 在 

using your own patched version 团队 支持 方面 可 能 会 有 问题 ， 特 别 是 当 升 级 到 新 版 本 的 时 

al porty code: 修一 重新 再 应 用 自 定义 的 修复 是 一 个 容易 出 错 的 过 程 ， 
有 引起 回归 的 危险 。 


因此 ， 最 好 的 解决 办 法 通常 是 在 短期 内 暂 搁 问题 ， 将 你 的 修复 融入 到 长 期 的 官方 发 布 版 中 。 
这 样 做 的 难 易 程度 在 很 大 程序 上 取决 于 谁 拥 有 代码 ， 以 及 你 和 他 们 的 关系 怎样 。 





8.7.3 开源 代码 
一 种 非常 重要 的 第 三 方 的 代码 是 开源 代码 。 
1. Linus 法 则 
RESPFEDRER, M 许多 人 认为 ， 开 源 从 根本 上 改变 了 调试 过 程 。 这 个 论 
FoRKBHBLAZE, 点 是 由 最 著名 的 Eric S. Raymond 在 《教堂 与 集 市 》[Ray01] 
Given enough eyeballs, ab ”这 本 书 中 提出 的 Linus 法 则 一 一 “只 要 给 予 足 够 的 关注 ， 
bugs are shallow: “ 所 有 的 缺陷 都 是 浅显 的 。”” 


就 Linux 这 种 规模 的 开源 项 目 而 言 ， 可 能 的 确 如 此 。 但 是 有 很 多 开源 项 目 只 获得 了 有 限 的 关 
注 。 所 以 ， 开 源 并 不 意味 着 传统 调试 的 立即 结束 。 


O 更 正式 地 说 ;“ 如 果 给 予 足 够 大 型 的 6 测试 和 合作 开发 基线 ， 几 乎 每 个 问题 可 以 被 很 快 地 定位 ， 也 会 找到 适合 修 
复 缺陷 的 人 。” 
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2. 开源 构建 过 程 


迄今 为 止 我 们 讨论 的 一 切 和 其 他 任何 方法 一 样 ， 都 适用 于 开源 项 目的 开发 , 但 是 有 几 个 特别 
相关 的 环节 一 一 构建 配置 和 提交 报告 。 


开源 的 本 质 意 味 着 你 不 能 以 中 心 化 的 方式 构建 软件 。 任 何人 可 以 在 他 们 选择 的 任何 时 间 里 构 
建 它 ， 他 们 构建 时 使 用 的 电脑 在 很 多 方面 与 你 的 也 相当 不 同 。 可 能 会 构建 在 不 同 的 操作 系统 上 ， 
使 用 不 同 的 编译 器 、 不 同 版 本 的 库 文件 和 不 同 的 配置 。 你 对 此 不 能 进行 控制 , 但 是 你 可 以 确保 尽 
可 能 完整 地 自动 化 构建 过 程 不管 谁 构建 了 软件 都 不 要 挑 三 拣 四 ) ， 确 保 你 能 够 收集 到 所 有 便于 
理解 所 需要 的 信息 ， 如 果 有 必要 ， 可 以 复制 它 所 构建 的 环境 。 


作为 一 个 很 好 的 例子 ， 来 看 看 Firefox 的 about:buildconfig 页 面 (图 8-2) 或 将 -V 命令 行 
选项 传 给 Apache HTTP 服务 器 。 


AAR about: buildconfig 


GaP CE) CD) CM) GGL aboutbuildconng Ar) GG Googe A) 
about:buildconfig 
Build platform 


target 
powerpe-apple-darwin8.8.4 





Build tools 


Compiler Version Compiler flags 

40 gee version 4.0.1 -Wall -W -Wno-unused -Wpointer-arith -Wcast-align -W -Wno-long-long -g -gfull 
goc (Apple Computer, -isysroot /Developer/SDKs/MacOSX 10 4u.sdk -fno-strict-aliasing -fpascal-strings 
„ach ppo Inc. build 5250) -fno-common -I/Developer/SDKs/MacOSX10.4u.sdk/Develope: 

-fno-rtti -fno-exceptions -Wall -Wconversion -Wpointer-arith -Woverloaded-virtual f 
gec version 4.0.1 -Wsynth -Wno-ctor-dtor-privacy -Wno-non-virtual-dtor -Weast-align -Wno-long-long | 
(Apple Computer, -g -gfull -isysroot /Developer/SDKs/MacOSX10.4u.sdk -fno-strict-aliasing -fpascal- 
varch ppe Inc, build 5250) strings -fno-common -fshort-wchar -/Developer/SDKs/MacOSX10.4u.sdk/Developer | 

/Headers/FlatCarbon i 


g++-40 


Configure arguments 


--target=powerpc-apple-darwin8.8.4 --with-macos-sdk=/Developer/SDKs/MacOSX10.4u.sdk --enable- f 
application=browser --enable-update-channel=release --enable-optimize --disable-debug --disable-tests --enable- ry 
update-packaging --enable-official-branding --enable-prebinding 











8-2 FIREFOX 的 ABOUT: BUILDCONFIG 页 


3. 参与 社区 
开源 社区 的 一 个 伟大 之 处 是 它 可 以 给 我 们 提供 极 大 的 帮助 。 你 不 仅 可 以 得 到 完全 免费 的 高 质 
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量 软件 ， 而 且 往往 同样 高 质量 的 技术 支持 也 是 免费 的 。 
但 是 有 效 地 寻求 帮助 是 一 门 艺 术 。 


O 首先 ， 做 你 应 该 做 的 。 检 查 文档 ， 经 常 提出 问题 ， 搜 索 邮 件 列表 和 博客 条 目 ， 看 看 是 否 
有 其 他 人 遇 到 同样 的 问题 。 

o 尽 可 能 多 地 给 出 信息 。 你 已 经 尝试 过 什么 了 ， 你 看 到 了 什么 结果 ， 为 什么 与 你 期 望 看 到 
的 不 同 ? 

O 请 记 住 , 开源 社区 成 员 通常 是 志愿 者 。 如 果 他 们 选择 来 帮助 你 (他们 可 能 会 真 的 帮助 你 )， 
那 也 是 他 自愿 的 。 


如 果 你 依靠 开放 源码 ,那么 要 尽 你 所 能 来 回报 社区 其 他 人 员 对 你 的 帮助 。 通 过 报告 和 描述 缺 
陷 的 方式 参与 到 Linus 法 则 中 。 如 果 你 修复 了 缺陷 ， 之 后 即 可 将 修复 程序 提交 回 中 央 进 行 处 理 。 
将 文档 、 教 程 和 例子 共享 给 大 家 ， 并 且 通 过 邮件 列表 和 论坛 来 回答 其 他 人 的 问题 。 


8.8” 付 诸 行 动 


o 修补 已 经 发 布 的 软件 的 时 候 ， 要 集中 精力 减少 风险 。 
o 在 修复 缺陷 的 过 程 中 不 断 监测 兼容 性 问题 。 

确保 你 已 完全 关闭 了 计时 窗口 ， 而 不 仅仅 是 缩小 了 尺寸 。 
o 当 遇 到 海 森 堡 缺 陷 时 ， 尽 量 降低 收集 信息 的 副作用 。 

O 修复 性 能 缺陷 往往 始 于 准确 的 特征 描述 。 

o 即使 是 最 有 限 的 沟通 渠道 也 足以 提取 你 所 需要 的 信息 了 。 
O 面 对 第 三 方 代码 ， 先 怀疑 自己 的 代码 。 





第 Oe 
理想 的 调试 环境 


调试 过 程 是 不 会 发 生 在 真空 中 的 。 提 前 了 解 好 基本 知识 , 未雨绸缪 ,等 你 真 的 遇 到 一 个 缺陷 
会 为 你 节省 大 量 的 时 间 、 精 力 并 减少 挫折 感 。 


在 这 一 章 中 ， 我 们 将 讨论 这 些 基本 知识 ; 


Q 一 个 完全 自动 化 的 测试 工具 ， 
O 源 程序 控制 ， 

O 一 个 完全 自动 化 的 构建 系统 ， 
口 持续 构建 或 持续 集成 。 


9.1 自动 化 测试 


前 面 讨论 过 , 通过 广泛 采用 自动 化 测试 和 重 构 , 敏捷 软件 开发 极 大 地 改变 了 软件 的 构建 过 程 。 
我 们 在 4.4 节 中 讲述 过 重 构 ， 本 节 我 们 来 讨论 测试 。 


9.1.1 有 效 的 自动 化 测试 
有 效 的 自动 化 测试 不 仅仅 意味 着 简单 地 使 你 的 测试 自动 化 。 为 了 达到 效益 最 大 化 ,你 的 测试 
必须 满足 以 下 目标 。 


“明确 说 明 测试 的 结果 是 通过 还 是 失败 每 个 测试 输出 一 个 结果 一 一 通过 或 者 失败 。 不 要 模 核 
两 可 ， 没 有 定性 的 输出 ， 没 有 解释 的 必要 。 只 简单 地 输出 是 或 不 是 就 可 以 了 。 


独立 ”运行 一 个 测试 程序 之 前 不 需要 安装 。 而 且 在 测试 运行 之 前 ， 它 能 够 自动 地 安装 任何 它 
需要 的 环境 ， 同 样 重要 的 是 ， 测 试 过 后 能 够 撤销 对 环境 所 做 的 任何 修改 ， 恢 复 开始 的 模样 。 

单 击 运行 所 有 测试 ”所 有 的 测试 都 可 以 一 步 运行 ， 而 不 会 互相 影响 。 与 单一 的 测试 一 样 ， 完 
整 的 测试 套件 的 输出 也 就 是 一 个 简单 的 通过 或 失败 一 一 如 果 每 一 个 测试 都 通过 即 认 为 是 通过 , 否 


= 


108 > 第 9 章 理想 的 调试 环境 


则 就 是 失败 。 


SHEE 很 容易 证 明 ， 对 任何 重要 的 代码 来 说 实现 完全 覆盖 都 是 极其 昂贵 的 。 但 是 ， 不 要 
让 这 种 理论 上 的 限制 阻碍 你 的 工作 一 一 做 到 足够 接近 完全 覆盖 是 有 可 能 的 。” 


9.1.2 自动 化 测试 可 以 作为 调试 的 辅助 


那么 ， 调 试 的 时 候 是 什么 让 自动 化 测试 更 有 价值 呢 ? 它们 可 以 在 各 个 阶段 为 我 们 提供 帮助 。 


O 首先 , 经 过 良好 测试 的 代码 往往 只 有 少量 的 缺陷 。 最 容易 修复 的 缺陷 就 是 根本 不 存在 的 缺 
陷 。 

Q 发 生 错误 后 越 快 发 现 错误 , 修复 起 来 就 越 容易 ,成 本 就 越 低 。 早期 测试 意味 着 大 多 数 的 缺 
陷 是 在 发 生 之 后 很 短 的 时 间 内 (通常 是 立即 ) 被 发 现 的 。 

O 自动 化 测试 是 一 个 持续 集成 的 关键 推动 因素 , 在 自动 测试 中 , 当代 码 完 成 之 后 就 立即 与 整 
个 产品 集成 起 来 了 。 在 本 章 后 面 我 们 将 进一步 讨论 这 个 问题 。 

o 自动 化 测试 能 使 你 经 常 发 布 新 版 本 的 软件 , 并 且 自 信 新 发 布 的 软件 可 以 正常 地 运行 。 这 意 
味 着 你 可 以 比 在 其 他 情况 下 更 快 地 从 最 终 用 户 那 里 获得 有 关 新 功能 和 缺陷 修复 的 反馈 (而 
且 ， 也 可 以 在 代码 写 完 后 尽快 发 现 缺陷 )。 它 也 可 以 减少 将 缺陷 修复 向 下 移植 到 前 几 个 软 
件 版 本 或 发 布 补丁 的 需求 。 

O 对 于 要 测试 的 代码 , 它 需要 构建 成 能 够 获取 中 间 结 果 和 内 部 结构 的 方式 , 而 其 他 办 法 可 能 
不 会 实现 。 这 种 获取 方法 在 后 面 的 调试 中 被 证 明 是 有 很 大 帮助 的 。 

O 编写 测试 程序 是 在 诊断 过 程 中 重 现 缺 陷 的 极 好 方法 。 很 多 被 用 来 支持 自动 化 测试 的 技术 对 
于 准确 地 重 现 缺 陷 来 说 是 极为 有 帮助 的 。 

O 当 你 完成 你 的 诊断 之 后 ， 自 动 化 测试 可 以 提供 强大 的 保护 措施 来 防止 在 修复 中 引入 回 
归 。 

如果 在 诊断 期 间 , 你 养 成 了 一 直 写 测试 来 重 现 缺陷 的 习惯 的 话 , 那么 你 自然 而 然 地 得 到 一 
个 回归 测试 ， 确 保 缺 陷 在 将 来 不 会 被 重新 引入 。 

o 自动 化 测试 是 重 构 的 关键 推动 因素 , 它 是 你 所 能 使 用 的 最 有 力 的 武器 ,可 确保 代码 在 整个 
开发 的 生命 周期 中 始终 保持 良好 结构 和 灵活 性 。 


当 与 一 种 现在 非常 流行 的 技术 一 一 代替 测 试 技术 相 结合 的 时 候 , 自动 化 测试 就 成 为 非常 强大 
的 测试 工具 。 


O 用 极限 编程 的 说 法 就 是 测试 “一 切 可 能 起 到 破坏 作用 的 代码 ”。 
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9.1.3 ”模拟 测试 、 社 测试 以 及 其 他 的 代替 测试 技术 


代替 测试 (test doubles) 是 在 测试 过 程 中 使 用 “虚拟 ”测试 对 象 来 代替 真实 的 测试 对 象 。 有 
几 种 代替 测试 技术 ， 最 常见 的 是 模拟 测试 和 桩 测试 。 


模拟 测试 和 桩 测试 经 常 被 混 清 。 桩 测试 是 被 动 的 ， 调 和 
用 时 对 已 存 的 数据 简单 地 做 出 响应 , REE, Re ae, 


可 以 验证 如 何以 及 何 时 被 调用 的 预期 结果 。 关 于 它们 之 间 Mocks are actives stubs are 
的 区 别 , 可 以 参考 Martin Fowler 的 “模拟 测试 不 是 桩 测试 ” _Passive， 
这 篇 文章 [Fow]。 


就 我 们 的 目的 而 言 ， 如 果 一 个 缺陷 与 系统 的 其 他 部 分 的 相互 作用 是 非常 重要 的 , 那么 试图 可 
靠 地 重 现 这 个 缺陷 时 ， 代 替 测 试 技术 是 十 分 有 帮助 的 。 


例如 ， 我 们 思考 一 下 ,一 个 Java 类 (从 一 台 服 务 器 获取 网 络 数据 ) 用 下 面 的 接口 ; 


public interface DataServer { 
boolean connect(String serverAddress); 
String fetchItem(int itemId); 
void disconnectQ); 

} 


假定 我 们 在 调用 它 的 代码 中 发 现 了 一 个 缺陷 , 这 个 缺陷 仅 当 fetchItem() 方 法 在 第 三 次 被 调 
用 并 抛 出 一 个 SocketTimeoutException 异常 时 发 生 。 通 过 择机 把 网 线 从 电脑 中 拔 出 来 的 方法 来 
重 现 缺陷 不 是 一 个 有 效 的 方式 。 

相反 ， 我 们 可 以 创建 一 个 简单 地 返回 正确 数据 的 桩 模块 来 调用 此 缺陷 : 


public class StubDataServer implements DataServer { 
public boolean connect(String serverAddress) { 
return true; 


} 
public String fetchItem(Cint ItemId) { 
switch(itemId) { 
case 1: return «Data item 1»; break; 


case 2: return «Data item 2»; break; 
case 3: throw new SocketTimeoutException("Timeout from stub"); 


} 
public void disconnect() { 
} 
} 
请 注意 ，StubDataServer 真 的 是 “很 笨 ”。 如 果 它 被 用 于 其 他 方面 ， 而 不 是 在 我 们 正在 使 用 
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的 测试 中 重 现 这 个 特定 的 缺陷 的 话 ， 它 是 没有 任何 帮助 的 。 "但 是 ， 这 不 要 紧 ， 我 们 已 经 创建 的 
代码 只 会 用 在 这 种 特定 的 背景 下 ， 不 需要 在 其 他 地 方 运行 。 


9.2 源 程 序 控制 


一 个 源 代码 控制 或 配置 管理 系统 是 可 以 跟踪 源 代码 和 整个 生命 周期 中 所 有 作出 修改 的 历史 
信息 的 资源 库 。 它 也 许 是 除了 编译 器 或 解释 器 之 外 你 能 使 用 的 最 重要 的 工具 了 。 


从 调试 的 角度 来 看 ， 源 程序 控制 所 提供 的 帮助 是 贯穿 于 整个 开发 过 程 的 。 它 是 一 个 受 控 构 建 
过 程 的 关键 要 素 , 能 确保 你 知道 正在 调试 的 内 容 , 知道 现在 运行 的 代码 与 用 户 使 用 的 代码 是 相同 
的 。 在 诊断 期 间 ， 它 可 以 精确 地 定位 引入 缺陷 的 修改 ,帮助 你 跟踪 所 尝试 的 实验 。 当 实现 你 的 修 
复 时 , 它 可 以 确保 你 做 出 真正 想 要 作出 的 修改 , 并 且 与 你 的 持续 集成 服务 器 相对 应 (我们 将 在 本 
章 后面 讨 论 持续 集成 )， 让 它们 按照 预期 工作 。 


大 多 数 与 源 程序 控制 相关 的 棘手 问题 都 是 与 分 支 有 关 的 。 分支 让 我 们 可 以 支持 在 同一 个 时 间 
内 并 行 开 发 某 一 个 软件 的 多 个 版 本 。 有 两 个 常见 原因 可 以 解释 为 什么 这 是 必需 的 ， 即 稳定 性 和 可 
维护 性 。 


9.2.1 稳定 性 


. 想象 一 下 ， 我 们 正在 开发 一 个 被 广泛 使 用 的 桌面 应 用 程序 的 2.0 版 。 事 情 进展 得 很 顺利 ， 
软件 已 经 达到 几乎 可 以 准备 发 布 的 程度 。 这 种 情况 下 许多 团队 开始 实施 变更 冻结 一 一 在 软件 进 
入 发 布 生命 周期 的 最 终 阶段 (如 a 和 BB 测试) 的 时 候 ， 延 迟 提交 任何 变更 都 有 可 能 影响 软件 的 
稳定 性 。 通 常 这 意味 着 “只 修复 严重 错误 ”。 在 一 些 项 目 中 ， 这 个 阶段 会 持续 数 月 。” 


这 很 有 道理 , 但 是 如 果 我 们 想 启动 开发 一 个 在 2.1 版 中 使 用 的 新 功能 , 那么 我 们 非 要 等 到 2.0 
版 稳定 之 后 再 实现 ? 


一 个 常用 的 方案 是 创建 一 个 发 布 分 支 一 一 用 2.0 版 的 源 程序 的 副本 。 在 发 布 之 前 ， 我 们 需要 
作出 的 任何 修改 都 要 进入 这 个 分 支 ， 同 时 开发 可 以 继续 畅通 无 阻 地 进行 。 关 于 发 布 分 支 的 图 形 示 
意 ， 见 图 9-1 左 侧 。 





© 将 它 与 10.2 节 “ 调 试 子 系统 ”进行 比较 ， 在 10.2 节 中 我 们 讨论 了 一 种 使 用 更 为 广泛 的 技术 。 
© 例如 , Æ Firefox 3 的 整个 发 布 过 程 中 ，Betal 版 在 2007 年 11 月 发 布 ， 第 一 个 试 发 行 版 本 是 2008 年 5 月 发 布 ， 最 
终 发 行 版 是 在 6 月 发 布 的 。 
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“点 ”维护 版 本 的 
发 布 分 支 发 布 分 支 

版 本 1.0 

版 本 ri BR 
版 本 1.0.1 
版 本 1.0.2 

版 本 y 分 支 

EF 
(2.0 开发 版 本 ) 
y 


图 9-1 分 支 


9.2.2 可 维护 性 


发 布 后 运行 得 很 顺利 ,许多 满意 的 用 户 正在 享受 着 2.0 版 ， 我 们 将 会 在 2.1 版 中 引入 一 些 令 
人 兴奋 的 新 功能 ， 一 切 进展 顺利 。 生 活 是 美好 的 。 


然而 缺陷 报告 却 来 了 一 一 在 2.0 版 中 有 一 个 关键 问题 必须 修复 。 现 在 该 怎么 办 ? 


那么 , 我们 当然 不 能 从 主干 发 布 ， 因 为 我 们 已 经 对 它 作出 了 很 大 的 修改 一 一 这 些 修改 还 没有 
经 过 足够 的 测试 检验 。 这 样 ， 我 们 在 稳定 期 作出 的 发 布 分 支 就 会 再 次 体现 出 它 的 价值 ， 我 们 称 之 
为 维护 分 支 。 


我 们 修复 着 分 支 中 的 缺陷 ， 将 版 本 号 提升 到 2.0.1， 生 活 再 次 变 得 美好 。 关 于 维护 分 支 上 点 
发 布 的 图 形 表示 ， 请 参阅 图 9-1 右 侧 。 


这 一 切 听 起 来 很 简单 ， 那 么 分 支 主 题 为 什么 会 使 疲 备 的 软件 工程 师 变 得 脸色 笋 白 ? 
9.2.3 与 分 支 相关 的 问题 
分 支 导致 重复 工作 。 每 次 我 们 解决 一 个 分 支 中 的 问题 , 几乎 肯定 都 需要 作出 同样 的 主干 改变 
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(或 者 更 糟 的 类 似 但 又 不 同 的 改变 ) 。 如 果 我 们 不 这 样 做 ， 


sittre, 那么 当 发 布下 一 个 版 本 时 我 们 将 要 陷入 回归 。 如 果 我 们 存 
Branching results in duplicate i npa 
Di 在 多 个 活跃 分 支 ， 那 么 在 其 他 分 支 中 我 们 也 不 得 不 这 么 

做 。 





将 一 个 分 支 的 修改 合并 入 另 一 个 分 支 是 很 难 理解 和 容易 出 错 的 , 尤其 是 当 分 支 有 明显 的 分 歧 
的 时 候 。 更 重要 的 是 ,对 合并 后 的 修补 程序 人 们 总 想 减免 测试 一 一 毕竟 ,我 们 已 经 在 合并 前 的 分 
支 中 测试 过 了 ， 因 此 再 次 测试 它 的 主干 有 些 浪费 时 间 ， 对 吧 ? 确实 是 ,直到 未 预见 的 问题 袭击 我 
们 的 时 候 才 不 这 么 认为 。 

对 于 源 程序 控制 系统 的 分 支 支持 差异 很 大 , 无 论 是 如 何 实现 分 支 (有 些 人 认为 源 程序 好 像 已 
经 被 复制 ， 有 些 人 只 不 过 把 分 支 当 作 是 一 个 单独 拷贝 的 不 同 的 “视图 ") ， 还 是 如 何 支持 分 支 。 分 
支 可 能 很 难 理解 ， 即 使 你 已 经 使 用 了 很 长 时 间 。” 接 口 通常 会 留 下 很 大 的 期 望 ， 并 且 他 们 能 以 令 
人 吃惊 的 方式 与 其 他 的 源 程序 控制 功能 进行 交互 。” 


因此 , 总 会 有 人 遗忘 了 那些 应 该 被 整合 的 变更 ， 也 总 有 变更 未 被 良好 整合 ， 它 们 破坏 了 构建 
过 程 或 者 引入 了 回归 。 一 般 来 说 ， 分 支 往 往 消 耗 大量 的 时 间 、 精 力 和 情感 。 


9.2.4 控制 分 支 


对 于 前 面 的 问题 来 说 ， 最 好 的 解决 办 法 是 不 要 使 用 分 支 。 但 这 并 不 总 是 能 做 到 ， 有 时 候 使 用 
分 支 是 必需 的 。 


但 是 大 量 的 经 验方 法 将 有 助 于 降低 解决 问题 的 难度 。 


O 尽 可 能 晚 地 使 用 分 支 。 可 能 你 总 想 事先 创造 稳定 分 支 毕竟， 如 果 一 些 稳定 分 支 是 好 的 ， 
那么 更 多 的 稳定 分 支 是 不 是 更 好 呢 )， 但 是 很 有 可 能 因为 创建 了 稳定 分 支 而 使 你 的 工作 效 
率 降 低 ， 这 样 是 很 不 值得 的 。 

O 坚持 分 支 的 单一 层级 。 如 果 你 发 现在 自己 的 分 支 上 进行 分 支 了 ， 就 应 该 知道 遇 到 麻烦 
了 。 

D 设置 你 的 持续 集成 服务 器 来 构建 所 有 正 处 于 活跃 状态 的 分 支 。 

Oo 要 经 常 签 入 一 些小 的 修改 。 小 的 修改 更 容易 理解 、 合 并 ， 必 要 时 还 好 撤销 。 

O 只 把 那些 确实 需要 在 分 支 中 进行 的 修改 加 入 到 分 支 中 。 


© 我 已 经 记 不 清 有 多 少 次 我 一 边 在 白板 上 画 “ 分 支 是 如 何在 Subversion 中 工作 的 ”一 边 给 我 的 一 名 同事 解释 一 一 经 常 是 
几 个 月 前 就 已 经 给 他 解释 过 的 同一 人 。 
© 例如 ，Subversion 的 外 部 项 目 ， 当 它们 所 在 的 项 目 被 列 人 分 支 时 它们 就 不 会 再 被 列 和 分支 。 
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n 将 分 支 合 并 到 主干 中 ， 而 不 是 从 主干 加 到 分 支 中 。 该 分 支 代表 发 布 的 软件 ， 因 此 分 支 中 
的 问题 要 比 在 主干 上 发 生 的 问题 更 严重 。 

口 立即 将 分 支 向 主干 合并 。 这 确保 了 合并 不 会 被 遗忘 ， 也 确保 了 在 你 对 所 作 的 修改 还 有 印 
象 的 时 候 就 这 样 去 做 了 。 不 要 收集 多 个 修改 一 下 子 全 部 合并 。 

O 保持 审计 跟踪 ， 以 使 你 知道 哪些 变化 已 经 被 合并 ， 什 么 时 候 被 合并 的 (不 是 所 有 的 源 程 
序 控制 系统 都 会 自动 地 为 你 做 这 件 事 ) 。 


W 小 乔 爱 问 
过 还 有 使 用 分 支 的 其 他 理由 吗 


稳定 性 和 可 维护 性 并 不 是 分 支 的 仅 有 正当 用 例 一 一 它们 在 探查 和 协作 中 同样 是 非常 有 
用 的 。 


如 果 你 想 安全 地 和 一 些 潜在 的 破坏 性 变更 打交道 ,私有 分 支 可 能 是 非常 有 用 的 。 分 支 还 
可 以 提供 一 种 方法 使 两 个 以 上 的 开发 人 员 可 以 针对 尚未 成 为 主 系统 的 一 部 分 的 模块 交流 代 
码 和 进行 协作 。 

为 这 些 目 标 而 创建 的 分 支 不 同 于 为 稳定 性 和 可 维护 性 而 创建 的 分 支 , 因为 它们 是 临时 性 


的 ，( 也 应 该 是 ) 短命 的 。 如 果 它 们 存在 的 时 间 过 久 ， 你 应 该 小 心 了 ， 因 为 它们 可 以 通过 代 
码 提供 一 个 “空子 ”而 绕 过 你 开发 过 程 中 的 重要 环节 。 





当 与 下 一 个 我 们 将 要 讲 到 的 技术 一 一 自动 构建 过 程 相 结合 的 时 候 , 源 程序 控制 就 会 变 得 非常 
地 强大 。 


9.3 自动 构建 


在 调试 过 程 中 你 需要 控制 的 一 个 最 重要 的 变量 就 是 软件 本 身 。 你 需要 能 够 识别 并 重新 创建 有 
明显 缺陷 的 相同 软件 。 具 体 来 说 ， 你 需要 控制 以 下 内 容 : 


软件 构建 时 的 源 程序 ， 
O 用 来 构建 它 的 工具 ， 
a 构建 时 对 这 些 工 具 进 行 的 选项 设置 ， 
口 任何 软件 链接 或 附带 的 第 三 方 库 。 
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构建 现代 软件 是 一 个 复杂 的 过 程 ， 其 中 会 使 用 很 多 需要 以 特定 的 顺序 和 方式 来 调用 的 工具 。 
有 些 团队 选择 通过 一 个 “如 何 构 建 XYZ 项 目 ”的 文档 去 说 明 如 何 来 做 。 一 个 好 得 多 的 解决 办 法 
就 是 将 软件 的 这 类 知识 编码 为 自动 化 构建 过 程 的 一 部 分 。 


9.3.1 ”一 键 构建 


你 的 目标 是 “一 键 ”构建 过 程 。 当 一 个 新 的 开发 人 员 可 以 加 入 团队 时 ， 你 已 经 成 功 完成 了 构 
建 过 程 , 将 源 代码 下 载 到 一 个 完全 没有 被 开发 的 机 器 中 ,运行 单个 命令 , 并 且 最 终 获得 一 个 完全 
编写 好 的 最 终 产品 版 本 ， 它 与 团队 中 成 员 编写 的 程序 是 一 模 一 样 的 。 


有 大 量 的 工具 可 以 帮助 你 实现 这 个 目标 。( 比 方 说 ， 如 果 你 使 用 Java 进行 开发 ， 那 么 可 以 用 
Maven， 如 果 你 使 用 C++， 可 用 Boost Build， 详 见 附录 A.2 节 。) 如 果 你 的 软件 遵循 一 个 合理 的 
标准 体系 结构 ， 你 就 会 很 幸运 ， 发 现 这 些 工具 能 给 你 现成 的 帮助 。 如 果 没 有 ， 你 就 不 得 不 编写 
一 些 自 定义 的 规则 。 你 做 这 些 所 花费 的 时 间 会 得 到 成 倍 的 回报 一 一 甚至 连 手动 步 又 都 是 会 回报 很 
多 的 。 





W NRE 
< 我 的 IDE 构建 系统 怎么 样 呢 


如 果 不 是 团队 中 的 每 个 成 员 都 使 用 ， 那 自动 构建 系统 的 价值 将 大 大 降低 。 例 如 ,有 时 开 
发 人 员 可 能 更 喜欢 IDE 为 他 们 提供 的 构建 系统 。 


大 多 数 .IDE 都 可 以 进行 外 部 构建 ， 所 以 看 看 你 是 否 能 以 这 种 方式 集成 你 的 自动 构建 系 


统 。 如 果 不 能 ， 那 么 花 时 间 使 其 尽 可 能 地 使 用 顺畅 ， 以 便 能 够 像 使 用 全 成 系统 那么 方便 地 使 
用 它 。 另 外 ， 现 在 一 些 集 成 开发 环境 都 支持 足够 成 束 的 构建 系统 ,如果 团 队 的 每 一 个 成 员 都 
乐意 使 用 相同 的 IDE， 你 可 以 以 此 作为 自动 构建 的 基础 。 


团队 需要 在 如 何 构建 软件 上 达成 一 致意 见 ， 并 且 坚 持 下 去 一 一 如 果 所 有 开发 者 都 以 不 同 
的 方式 构建 ， 那 么 遇 到 问题 是 迟早 的 事 。 





———THREABSLA, 人 ”你 的 系统 应 该 始终 自动 化 整个 过 程 ， 直 到 最 终 发 布 软 
ULET 件 。 如 果 你 的 软件 是 打包 成 一 个 安装 程序 ， 构 建安 装 程序 


Automate your entire build 也 应 该 是 自动 的 。 如 果 在 源 程序 控制 中 你 使 用 标记 来 记录 
process» from start tp 刀 构建 的 过 程 ， 那 么 创建 标记 应 当 自动 的 。 每 次 运行 构建 的 
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时 候 你 不 用 总 执行 这 些 步骤 (例如 ， 在 开发 过 程 中 在 你 自己 的 机 器 上 构建 时 )， 但 是 ， 那 只 会 使 
自动 化 变 得 更 重要 一 一 恰恰 是 你 做 得 越 少 的 事 越 容易 出 错 。 


9.3.2 ”构建 机 器 


你 的 自动 生成 过 程 应 保证 每 个 人 都 准确 地 得 到 完全 相同 的 结果 ， 无 论 他 们 什么 时 候 进 行 构 
建 。 但 是 开发 者 的 机 器 往往 在 不 断 变化 一 一 我 们 正在 为 新 的 功能 修改 本 地 的 源 程 序 ， 或 者 我 们 正 
在 实验 新 版 的 构建 工具 。 


发 布 软 件 时 ， 任 何事 物 所 处 的 状态 都 应 是 众所周知 —SRRERARAR DH 
的 ， 这 一 点 很 重要 。 在 开发 机 器 上 做 到 这 点 可 能 很 困难 RLHEARE KORA, 

而 且 容 易 出 错 。 所 以 ， 有 一 个 构建 机 器 专门 用 于 构建 发 Never release software built 
布 版 本 是 一 个 非常 好 的 主意 (如果 软件 是 跨 平 台 软 件 ， -developer's machine 
可 能 是 几 台 构建 机 器 )。 它 应 该 始终 保持 初始 状态 ， 不 被 用 于 其 他 任何 事情 ， 你 可 以 相信 它 处 
于 正确 的 状态 。 


一 台 构 建 机 器 是 值得 拥有 的 ， 但 你 可 以 通过 采取 进一步 的 措施 让 它 变 成 一 个 持续 集成 服务 
器 ， 为 团队 增加 它 巨大 的 价值 。 


9.3.3 ”持续 集成 


在 软件 开发 生命 周期 中 , 有 几 个 时 间 点 的 风险 从 本 质 上 说 要 比 其 他 的 风险 高 。 其 中 风险 最 大 
的 是 集成 由 团队 中 不 同 成 员 所 作出 的 修改 时 。 当 你 在 本 机 上 测试 你 自己 的 修改 时 , 一切 都 很 顺利 ， 
但 是 将 你 的 修改 与 别人 的 修改 集成 起 来 时 ， 就 会 出 现 问题 。 


你 的 构建 机 器 作为 一 个 持续 集成 服务 器 实现 了 它 自身 
的 巨大 价值 。 每 当 有 任何 对 源 程 序 的 修改 ， 它 都 会 自动 检 
查 出 来 ， 构 建 并 运行 整个 测试 套件 (一 个 典型 的 持续 集成 Run your tests every time 
系统 如 图 9-2 所 示 )。 如 果 构 建 或 任何 测试 失败 了 ， 它 会 发 _you change the software. 
送 邮件 到 团队 中 以 便 问题 尽快 地 得 到 解决 。 

有 大 量 的 非常 不 错 的 持续 集成 服务 器 包 可 供 我 们 使 用 (A2 节 中 提供 了 清单 )， 但 是 如 果 有 


一 个 很 好 的 自动 构建 系统 ,自己 创造 一 个 也 是 非常 容易 的 ， 所 以 如 果 你 需要 就 不 要 迟疑 ， 自 己 做 
一 个 吧 。 


每 名 你 修改 软件 时 请 运行 
测试 
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00O CruiseControl.rb = 
QED @& CS D] https:/ /cruise.texperts.com/ 
了 TEN FREE TE Md es TOS A SOON 
Dashboard 
SruiseControl rh Documeneaven 
b aa a OA henry.addison@reSultcom committed the checkin 
build Comments: 
§ No longer require UI right for pegasus part 


10871.1 (2 jul) took 18 seconds 
10871 (17 jun) 

10770 (10 Jun} 

10426.1 (30 May) 

10426 (22 May) 


shared _plugins SD (ed erick.cheung@result.com committed the checkin | 


Comment 
a. add ni, app to shared config 
11773 (22 Aug) took 1 minute 
11739 (19 Aug) 
11728 (18 Aug) 
11727 (18 Aug) 


11561 (5 Aug) | 
frederick.cheung@reSult.com committed the checkin | 
gatekeeper ce i | 
buil Comments | 
A| fix plugin list 
10769.1 (2 Jul) took 13 seconds f 
10769 (10 Jun) 
10766 (10 Jun) FAILED j 
10427.1 (30 May) $ 
10427 (22 May) ' f 
henry.addi: Sulti tted the checki f 
numbers er eee ry. json@reSult.com commi eckin L 
build Comment: a 
S| pa Added an easy way of clearing the search fields for the mobile DQ wizard a 





9-2 ”持续 集成 服务 器 


9.3.4 创建 版 本 


现在 ， 错 误 报告 告诉 你 ， 缺 陷 发 生 在 3.6.209 (e3) 中 。 太 好 了 。 现 在 它 要 告诉 你 什么 呢 ? 


只 有 当 你 能 够 确定 到 底 是 什么 对 其 进行 构建 时 ， 它 才 是 有 用 的 信息 ,这 意味 着 需要 给 源码 控 
制程 序 加 上 版 本 号 。 因 此 , 无 论 什么 时 候 发 布 ， 你 都 需要 确保 记录 了 哪些 源 代码 被 用 来 创建 发 布 
版 本 。 


根据 不 同 的 源 代码 控制 系统 , 这 可 能 意味 着 建立 一 个 标记 、 一 个 分 支 、 一 个 标签 或 别 的 东西 。 
无 论 你 使 用 什么 机 制 ， 都 需要 让 版 本 号 与 源 代码 之 间 保 持 一 对 一 的 关系 。 


这 是 一 个 非常 重要 的 必然 结果 一 _ 绝 不 重复 使 用 版 本 
pe RADARE, RAKK 号 REAR ARTZ AVL 
ern minber: 版 本 生成 新 的 版 本 号 。 boem, 下 面 这 各 


话 都 是 适用 的 : 不 同 的 源 代 码 ， 不 同 的 版 本 号 。 
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9.3.5 ”静态 分 析 


大 部 分 的 调试 依赖 于 动态 分 析 一 一 在 软件 执行 的 时 候 检验 它 。 但 事实 证 明 , 很 多 缺陷 可 以 仅 
通过 静态 地 检查 源 代码 而 被 识别 出 来 。 更 妙 的 是 ,这 种 类 型 的 静态 分 析 可 以 自动 化 ， 可 以 被 集成 
到 你 的 开发 流程 中 ， 在 你 甚至 还 设 开始 运行 代码 之 前 就 检测 到 缺陷 了 。 


有 些 团队 使 用 连续 构建 和 置 烟 测试 (以 硬件 工程 师 进 行 的 测试 来 命名 的 ， 当 他 们 第 一 次 
通 上 电源 时 ， 硬 件 是 不 是 冒 了 一 股 蓝 烟 然后 就 不 工作 了 呢 )。 微 软 将 这 种 方法 显赫 地 应 用 在 
Windows NT 的 发 展 过 程 中 ， 如 Show-stopper!— + {Zac94] 所 述 。 


如 你 所 料 ， 持 续集 成 、 连 续 构 建 和 置 烟 测试 有 许多 共同 点 ， 并 有 许多 相同 的 优势 。 在 正 
常情 况 下 ,持续 集成 是 最 好 的 ，( 如 果 你 能 这 样 连续 不 断 地 做 ,为 什么 需要 通宵 集成 呢 ? ) 但 
是 如 果 你 的 测试 套件 需要 极 长 的 运行 时 间 ， 可 能 在 晚上 构建 就 是 你 唯一 的 选择 了 。 


如 果 你 的 测试 确实 要 花费 很 多 时 间 而 不 能 运行 , 请 考虑 创建 一 个 简短 的 测试 套件 ,可 以 
检测 每 个 签 入 的 代码 ， 也 可 以 通宵 地 运行 全 部 套件 。 





如 果 你 已 经 花 时 间 阅 读 过 别人 的 代码 ， 就 会 知道 ， 一 些 缺 陷 就 在 你 的 身边 。 有 一 些 特定 的 模 
式 ， 尽 管 它们 是 合法 的 代码 ， 但 几乎 可 以 肯定 的 是 它们 没有 体现 作者 的 真实 意思 。 


下 面 是 一 个 简单 的 Java 例子 ， 你 可 以 当场 指出 以 下 代码 的 错误 吗 ? 


if(«first condition» & 
«second condition» || 
«third condition»); 

{ 
«some code» 


} 

任何 曾 从 事 过 类 C 语 言 (C、C++、Java、C# 等 ) 工作 的 人 ， 肯 定 都 曾 被 上 面 的 问题 困扰 过 。 
如 果 你 还 没有 遇 到 这 样 的 问题 那么 我 告诉 你 , 问题 就 是 在 让 条 件 后 的 分 号 ， 这 意味 着 后 面 的 语 
句 块 将 永远 被 执行 ， 无 论 条 件 结果 如 何 。 


经 验 告诉 我 们 ， 事 实 上 有 很 多 代码 的 模式 ， 在 一 定 程度 上 是 值得 怀疑 的 。 除 了 上 面 这 个 例子 
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外 ， 还 包括 无 法 访问 的 代码 〈 可 能 永远 不 被 执行 ,无 论 程序 处 于 什么 状态 ) 和 未 使 用 的 变量 (被 
声明 了 ， 甚 至 被 赋值 了 ， 但 从 来 设 被 读 取 过 ) 。 例 如 ， 在 下 面 的 Java 方 法 中 ，@ 处 的 变量 未 被 使 
用 ，@ 处 的 代码 不 可 访问 : 


public static boolean allUpper(String s) { 
o int length = s. length); 


if (s == null) { 
return false; 
@ System.out.printiIn("Null string passed to allUpper"); 
CharacterIterator i = new StringCharacterIterator(s); 
for (char c = i.first(); c != CharacterIterator.DONE; c = i.next()) 
if (Character.isLowerCase(c)) 


return false; 


return true; - 


不 要 忘记 编译 器 


在 开始 寻找 新 的 工具 之 前 ,不 要 忘记 编译 器 。 多 年 来 ， 现 代 编 译 器 已 经 具备 一 系列 的 警 
告 信息 ， 在 某 些 情况 下 ， 甚 至 可 以 让 专用 的 静态 分 析 工 具 相 形 见 纳 。 


问题 就 是 它们 常常 不 是 默认 启动 。 所 以 ， 不 要 仅仅 因为 你 的 代码 编译 器 现在 没有 和 警告 信 


息 就 作出 这 样 的 假设 , 以 为 编译 器 没有 找 出 一 些 潜在 的 问题 。 花 点 时 间 去 阅读 你 的 编译 器 文 
档 一 一 通常 你 会 发 现 一 些 有 用 的 敬告 功 能 需要 单独 启用 。 例 如 ，GCC 编译 器 的 -Wal1 $ 
项 ， 你 可 能 会 天 真 地 认为 将 会 启用 所 有 的 警告 功能 ， 但 实际 上 却 禁 用 了 很 多 非常 有 用 的 功 
能 。 你 可 以 使 用 -Wextra 启用 更 多 的 功能 ， 但 即使 是 这 样 ， 仍 然 有 很 多 功能 需要 你 自己 单 
独 启用 。 





一 个 有 趣 的 情况 是 , 我 们 可 能 无 意 中 编写 了 依靠 未 定义 行为 的 代码 。 许多 语言 规范 都 有 一 些 
黑暗 的 角落 , 那里 有 可 能 写 的 是 看 上 去 非常 好 的 代码 , 而 事实 上 不 可 能 去 预测 它 的 行为 到 底 是 什 
么 样 的 。 下 面 是 一 个 C++ 的 例子 《C++ 是 一 门 充满 着 黑暗 角落 的 语言 ) ; 

int x = 1; 


X = X++; 


// x 取 什么 值 呢 ? 
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答案 是 ，x 可 以 取 任 何 值 一 一 C++ 标准 根本 没有 界定 这 段 代 码 要 做 什么 。 在 实践 中 ， 大 多 数 
编译 器 会 做 一 些 “ 明 智 ”的 事情 ， 通 常 x 将 最 终 等 于 1 或 2。 但是， 从 理论 上 来 说 ， 它 最 终 可 能 
等 于 42， 该 程序 可 能 崩溃 ， 或 出 现 别 的 状况 。 这 就 是 没有 明确 的 定义 。 


有 趣 的 是 ， 如 果 在 Java 中 编译 相同 的 代码 ， 那 么 它 的 行为 是 确定 的 一 一 x 的 值 永远 是 1。 但 
是 , 不 要 太 沾沾自喜 ,你 这 个 Java 开 发 人 员 一 一 程序 的 行为 可 能 被 定义 , 但 它 仍 然 几乎 肯定 是 一 
个 缺陷 。 大 概 写 这 个 代码 的 人 打算 让 它 做 一 些 事情 , 而 事实 上 它 什 么 也 没 做 。 因 此 ， 尽 管 他 们 期 
望 它 这 样 做 ,但 它 没有 这 样 做 。 


关于 每 种 语言 都 有 一 定数 量 可 利用 的 工具 , 这 些 工具 可 以 检查 代码 寻找 此 类 问题 。 它 们 的 前 
身 就 是 1int， 早 在 70 年代 就 在 C 程 序 中 发 现 缺 陷 ， 在 某 种 程度 上 Vint 已 经 成 为 现 如 今 所 有 此 
类 开发 工具 的 一 个 通用 术语 。 


9.3.6 ”使 用 静态 分 析 


静态 分 析 的 伟大 之 处 在 于 它 给 我 们 提供 了 一 种 几乎 免费 的 缺陷 检测 的 方式 。 我 们 可 以 简单 地 
通过 这 些 工具 运行 代码 并 找到 问题 所 在 , 而 不 是 等 待 一 个 错误 出 现 (无 论 是 在 测试 过 程 中 还 是 在 
实际 应 用 中 )， 然 后 经 历 漫长 的 问题 重 现 、 诊 断 和 修复 过 程 。 不 是 这 样 吗 ? 


因此 ,第 一 条 规则 是 使 用 静态 分 析 。 开 启 编译 器 支持 的 所 有 警告 功能 ， 并 在 你 的 开发 环境 中 
使 用 任何 可 能 有 用 的 工具 。 


第 二 条 规则 是 将 你 选择 的 工具 或 工具 集 紧密 地 集成 —PEteeganas ds 
到 你 的 开发 过 程 中 。 不 要 只 是 偶尔 地 运行 它们 ， 例 如 到 了 ARF. 
寻找 某 个 缺陷 的 时 候 才 临时 抱 抱佛脚 。 每 当 你 编译 源 代码 Integrate static analysis 
的 时 候 都 要 运行 它们 。 将 它们 产生 的 警报 视 为 错误 ， 并 立 inte your build process: 
即 解决 这 此 缺陷。 


本 章 讲 述 了 软件 之 外 的 一 些 技术 。 但 是 还 有 其 他 一 些 技术 被 构建 到 软件 本 身 之 中 了 ， 那 是 我 
们 下 章 讨 论 的 主题 。 


D 例如 多 数 编译 器 会 提供 一 个 将 警告 视 为 错误 的 选项 ， 例 如 GCC 的 -werror。 
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Ww 小 乔 爱 问 
过 我 怎么 才能 没有 警告 呢 


如 果 从 头 写 一 个 新 的 项 目 , 那么 编写 一 个 没有 警告 信息 的 代码 是 很 容易 的 。 但 是 如 果 从 
一 个 已 经 存在 的 代码 库 中 开始 编写 , 那 就 不 是 很 容易 了 。 很 有 可 能 第 一 次 提高 编译 器 的 警告 
级 别 或 运行 一 个 新 的 工具 的 时 候 , 你 会 被 大 量 的 警告 信息 所 滤 没 。 这 些 常常 是 代码 的 系统 问 
题 一 一 你 已 经 一 而 再 地 犯 过 的 一 些 常见 的 错误 ， 到 现在 也 没有 人 知道 ,但 是 这 些 错误 的 每 一 
个 实例 都 产生 了 警告 信息 。 也 有 一 些 问 题 是 通过 生成 警告 信息 的 代码 “过 滤 ” 出 来 的 《C++ 
中 的 const 正 确 性 是 一 个 典型 的 例子 )。 


解决 的 办 法 是 务实 一 些 。 大 多 数 的 静态 分 析 工 具 针 对 在 哪儿 生成 了 什么 样 的 警告 信息 提 
供 了 甸 粒 度 的 控制 (例如 ， 通 过 嵌入 在 源 代码 中 的 注释 )。 很 多 时 候 你 可 以 通过 关闭 一 个 或 
两 个 负责 主要 模块 的 警告 功能 或 者 排除 一 个 “问题 ”模块 ， 将 警告 数量 降低 到 可 以 管理 的 水 
平 ,你 可 以 稍 后 回去 修复 其 他 的 警告 ,但 是 在 过 渡 期 间 你 可 以 获得 静态 分 析 带 来 的 许多 好 处 。 


在 有 些 军 见 的 场合 ， 如 一 个 有 问题 的 工具 把 合法 的 代码 当成 假 警告 或 者 你 有 意 地 去 编 
写 “ 有 问题 ”的 代码 ， 或 者 一 个 第 三 方 库 文件 生成 敬告， 上述 同样 的 方法 也 会 很 有 帮助 。 





9.4” 付 诸 行动 


口 自动 化 你 的 测试 ， 确 保 它们 : 

里 明确 说 明 测试 的 结果 ， 通 过 还 是 失败 

m 是 独立 的 ; 

m 能 够 一 键 执行 ， 

= 做 到 全 面 覆 盖 。 

在 源 代码 控制 中 谨慎 地 使 用 分 支 。 

自动 化 你 的 构建 过 程 。 

a 每 当 软 件 发 生变 化 时 ， 都 进行 构建 和 测试 ， 
n 在 每 一 次 构建 中 都 集成 静态 分 析 。 


D D 


和 


第 7(0) 章 
让 软件 学 会 自己 寻找 缺陷 


已 经 有 许多 书 或 文章 探讨 如 何 编写 好 软件 ， 但 却 少 有 讨论 如 何 编写 容易 调试 的 软件 的 。 

好 在 如 果 遵 从 创建 良好 软件 的 一 般 原 则 ， 即 分 离 问题 、 避 免 复制 、 隐 藏 信息 ， 并 创建 结构 良 
好 、 易于 理解 和 修改 的 软件 , 那么 你 也 就 能 编写 出 容易 调试 的 软件 。 良好 的 设计 与 调试 并 无 冲突 。 

不 过 你 仍然 可 以 做 好 其 他 准备 工作 帮助 你 追踪 问题 。 本 章 将 介绍 以 下 方法 , 让 调试 工作 变 得 
容易 ， 甚 至 在 某 些 情况 下 不 必 做 调试 都 行 。 

o 使 用 断言 自动 地 验证 假设 

调试 构建 

O 在 异常 处 理 代 码 中 自动 地 检测 问题 


10.1 假设 和 断言 

代码 的 每 一 块 都 建立 在 一 个 无 数 假设 的 平台 上 面 一 一 某 些 条 件 必 须 是 正确 的 才能 让 运行 结 
果 符 合 预期 。 往 往 缺 陷 的 出 现 是 因为 某 些 假设 是 不 成 立 的 或 者 是 错误 的 。 

避免 做 出 这 些 假设 是 不 可 能 的 也 是 无 意义 的 。 但 好 在 我 们 不 仅 可 以 验证 它们 , 而 且 可 以 通过 
断言 来 自动 验证 。 

断言 是 什么 样子 的 ?在 Java 中 有 两 种 格式 ， 第 一 种 是 像 下 面 这 样 的 简单 格式 : 


assert «condition»; 


第 二 种 格式 包含 一 条 信息 ， 如 果断 言 失败 就 会 显示 该 信息 : 


assert «condition» : «message»; 


无 论 使 用 哪 种 格式 ， 无 论 何 时 被 执行 ， 断 言 都 要 计算 条 件 。 "如 果 条 件 计 算 结果 为 真 ， 那 么 它 
什么 也 不 做 ， 如 果 为 假 ， 它 将 抛 出 一 个 AssertionError 异常 ， 这 一 般 意 味 着 程序 会 立即 退出 。 


O 如 果 启 用 了 断言 功能 ， 我 们 会 很 快 得 到 。 


122 > 第 10 章 让 软件 学 会 自己 寻找 缺陷 


W 小 乔 爱问 
CU 进行 单元 测试 的 时 候 是 否 需 要 断言 


一 些 人 认为 , 对 于 试图 使 用 断言 来 解决 的 问题 自动 化 单元 测试 是 一 个 更 好 的 方法 。 这 种 
想法 在 某 种 程度 上 可 能 来 自 于 一 个 不 幸 的 事实 ， 即 JUnit 提供 的 可 以 在 测试 中 验证 某 些 条 件 
的 函数 也 叫 作 断言 (有 点 儿 令 人 帝 解 )。 


这 不 是 一 个 非 此 即 彼 的 问题 , 而 是 要 双管齐下 。 断 言 和 单元 测试 是 解决 相关 但 不 同 问题 
的 方法 。 单元 测试 不 能 检测 没有 在 测试 用 例 中 被 引用 的 缺陷 。 而 任何 时 候 都 可 以 使 用 断言 来 
检测 缺陷 ， 无 论 是 在 测试 中 还 是 其 他 的 什么 场合 。 


一 种 去 思考 单元 测试 的 方法 就 是 把 它们 (部 分 地 ) 当 作 保证 所 有 的 断言 能 够 被 时 常 执行 
的 手段 。 





现在 我 们 有 足够 的 理论 了 ， 那 么 实际 中 该 如 何 来 做 呢 ? 
10.1.1 一 个 例子 


想象 一 下 我 们 正在 编写 一 个 需要 发 出 HTTP 请 求 的 程序 。HTTP 请 求 非常 简单 ， 由 几 行 简单 
的 文本 构成 。 第 一 行 指定 方法 (例如 GET 方法 或 者 POST 方法 ) ， 一 个 URI 和 我 们 使 用 的 HTTP 
协议 的 版 本 。 随 后 几 行 包括 一 系列 的 键 / 值 对 (每 行 一 对 )。” 对 于 GET 请 求 这 就 足够 了 (其 他 的 
请 求 可 能 需要 包括 请 求 的 主体 ) 。 

我 们 将 定义 一 个 名 叫 HttpMessage 的 Java 类 来 生成 GET 请 求 。 代 码 如 下 : ” 


public class HttpMessage { 


private TreeMap<String, String> headers = new TreeMap<String, String>(); 


o public void addHeader(String name, String value) { 
headers.put(name, value); 
} 
© public void outputGetRequest (OutputStream out, String uri) { 


PrintWriter writer = new PrintWriter(out, true); 


D 详 见 超 文本 传输 协议 [iet99j 规 范 。 
O 当然 , 如 果 有 很 多 可 用 的 经 过 良好 调试 的 HTTP 库 文件 ， 你 是 不 会 自己 写 这 些 代码 的 。 但 它 对 于 我 们 学 习 来 说 是 
一 个 不 错 的 简单 易 懂 的 例子 。 


10.1 假设 和 断言 A 123 


writer.printin("GET " + uri + " HTTP/1.1"); 
for (Map.Entry<String, String> e : headers.entrySet()) 
writer.printin(e.getKey() + ”: " + e.getValue()); 
} 
} 


这 个 类 非常 简单 一 一 addHeader 人 0 方法 全 仅仅 将 一 个 新 的 键 / 值 对 添加 到 headers 中 ， 同 时 
outputGetRequest() 方 法 @ 生 成 起 始 行 ， 后 面 依 次 跟着 每 一 个 键 / 值 对。 


下 面 是 我 们 可 能 的 用 法 : 
HttpMessage message = new HttpMessage(); 


message.addHeader("User-Agent", “Debugging example client"); 
message.addHeader("Accept", "text/html, text/xml"); 


message.outputGetRequest(System.out, "/path/to/file"); 


上 面 的 代码 执行 结果 如 下 : 


GET /path/to/file HTTP/1.1 
Accept: text/html], text/xml] 
User-Agent: Debugging example client 


到 目前 为 止 都 是 很 简单 的 ， 哪 块 可 能 出 错 呢 ? 


W ngga 
X 我 如 何 选择 一 个 好 的 断言 消息 


本 书 早 期 的 一 个 审阅 者 ， 在 Google 北京 办 公 室 发 现 了 一 张 海 报 ， 所 有 地 方 的 海报 都 是 
这 样 ， 上 面 写 着 ; “确保 你 的 出 错 消息 可 以 帮助 你 调试 错误 ， 不 能 只 提醒 你 需要 调试 错误 。 


他 们 引用 的 例子 是 一 个 一 般 格式 的 断言: 
assert_lists_are_equal(list1, list2); 
如 果 这 个 断言 失败 了 ,那么 它 会 告诉 你 两 个 列表 中 的 值 是 不 相等 的 。 你 仍 将 返回 到 代码 


中 去 寻找 从 列表 的 什么 地 方 开始 它 的 值 变 得 不 同 。 无 论 师 序 是 否 改变 ,最 好 是 显示 出 第 一 次 
出 现 差异 的 元 素 ， 或 者 其 他 一 些 有 利于 问题 诊断 的 事物 。 





当然 , 我 们 的 代码 是 非常 值得 信任 的 。 但 是 它 仅仅 是 显示 出 我 们 给 它 传递 的 信息 。 这 意味 着 
如 果 使 用 无 效 的 参数 调用 ， 它 就 会 生成 无 效 的 HTTP 请 求 。 例 如 ， 如 果 这 样 调 用 addHeaderO Jy 
法 : 


message.addHeader(””, "a-value"); 
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那么 我 们 最 终 将 获得 如 下 的 信息 头 ， 它 发 送 到 哪个 服务 器 都 会 引起 混乱 的 。 


: a-value 


通过 在 addHeader() 方 法 的 头 部 使 用 如 下 的 断言 ， 我 们 可 以 自动 地 检测 这 种 情况 是 否 发 生 


assert name.length() > 0 : "name cannot be empty"; 


现在 ， 如 果 我 们 所 调用 addHeader 〇 函数 里 面 的 参数 为 空 字符 串 ， 当 断言 执行 的 时 候 ， 程 序 
会 立刻 跳出 如 下 语句 : 


Exception in thread "main" java.lang.AssertionError: name cannot be empty 
at HttpMessage.addHeader (HttpMessage. java:17) 
at Http.main(Http. java:16) 


10.1.2 等 一 下 一 刚才 发 生 了 什么 


让 我 们 花 一 点 时 间 来 看 看 刚才 究竟 做 了 些 什 么 。 我 们 仅仅 是 在 软件 中 添加 了 简单 的 一 行 代 
码 , 但 是 这 一 行 代码 的 表现 令 我 们 印象 深刻 。 我 们 正在 教程 序 自己 寻找 缺陷 。 现 在 ， 当 程序 出 现 
错误 时 ， 不 是 我 们 主动 地 去 寻找 缺陷 ， 而 是 程序 自己 通知 出 错 并 告诉 我 们 这 个 缺陷 的 相关 信息 。 


在 用 户 发 现 之 前 自己 在 测试 阶段 找到 缺陷 , 这 是 非常 理想 的 。 但 是 在 我 们 追踪 现场 发 现 的 错 
误 时 断言 还 是 非常 有 用 的 。 只 要 我 们 找到 一 种 复制 问题 的 方法 , 很 有 可 能 断言 就 会 立刻 指出 有 什 
么 违反 了 我 们 的 假设 ， 这 在 诊断 中 可 以 大 大 地 节省 时 间 。 


10.1.3 例子， 第 二 幕 


现在 ,我 们 走 上 了 测试 的 道路 ， 我 们 可 以 走 多 远 ? 其 他 类 型 的 缺陷 我 们 能 自动 检测 到 吗 ? 


自动 化 地 检测 空 字符 串 是 没有 任何 问题 的 , 但 是 在 我 们 的 类 中 是 不 是 还 有 其 他 一 些 非常 明显 
的 不 良 的 使 用 方式 呢 ? 一 旦 我 们 开始 考虑 这 个 问题 ， 就 可 以 发 现 很 多 这 样 的 问题 。 

第 一 ， 空 字符 串 不 是 唯一 的 一 种 无 效 的 报头 一 一 HTTP 规范 规定 了 许多 字符 不 能 作为 报头 名 
字 。 在 addHeader 了 函数 中 添加 下 面 这 些 代码 可 以 让 我 们 确定 没有 使 用 这 些 关键 字 作 为 报头 名 : ” 


assert !name.matches(”. *[\\C\\)<>@, ; A\Z NN J.*):; 
"Invalid character in name”; 


第 二 ， 下 面 这 些 调用 是 什么 意思 ? 


message.addHeader("Host", "somewhere.org”); 
message.addHeader("Host”, “nowhere.com"); 


© 不 要 过 于 担心 密密麻麻 的 正则 表达 式 代码 一 一 它 匹配 一 组 简单 的 字符 。 它 看 起 来 较为 复杂 ,因为 某 些 字符 需要 用 
反 斜 杠 进行 转 义 ， 而 且 所 有 的 反 斜 线 本 身 也 需要 转 义 。 
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HTTP 报头 在 消息 中 只 能 出 现 一 次 ， 所 以 重复 添加 就 是 一 个 缺陷 。 "这 是 一 个 通过 在 
addHeader( 〇 函数 的 头 部 添加 如 下 代码 后 我 们 能 够 自动 捕捉 到 的 缺陷 : 


assert !headers.containsKey(name) : “Duplicate header: ”+ name; 
其 他 一 些 我 们 可 以 考虑 的 检测 (这 取决 于 我 们 如 何 预见 所 使 用 的 类 ) 可 能 包含 如 下 一 些 。 


Q 确认 outputGetRequestQ 〇 只 执行 了 一 次 而 且 addHeader 〇 在 它 之 后 不 被 调用 。 

n 确认 在 每 次 请 求 中 我 们 想 要 包含 的 报头 信息 都 被 添加 了 。 

O 检查 赋 给 头 部 信息 的 值 以 确保 它们 是 格式 良好 的 (例如 ，Accept 报头 总 需要 被 赋 给 一 个 
MIME 类 型 的 列表 )。 


例子 就 讲 这 么 多 。 那 有 没有 一 些 普遍 的 规律 能 帮助 确定 我 们 该 断言 哪 一 类 的 问题 呢 ? 
10.1.4 契约 ， 先 决 条 件 ， 后 置 条 件 和 不 变量 


考虑 在 两 段 代 码 之 间 使 用 接口 的 方法 之 一 是 契约 。 调用 代码 保证 给 被 调用 代码 提供 预期 一 定 
使 用 的 环境 和 参数 。 反 过 来 , 被 调用 的 代码 保证 执行 一 些 特定 的 行为 或 者 返回 一 些 调用 代码 要 使 
用 的 特定 的 值 。 


考虑 下 面 三 类 条 件 ， 它 们 一 起 构成 一 个 契约 。 


先决 条 件 ”对 于 方法 来 说 ， 先 决 条 件 是 那些 在 方法 被 调用 之 前 就 必须 满足 的 条 件 ， 它 保证 
方法 可 以 按照 预期 来 运行 。 对 于 我 们 的 addHeaderO 〇 来 说 ,先决 条 件 是 参数 不 为 空 ， 不 能 包含 无 
效 的 字符 等 等 。 


后 置 条 件 ” 对 于 方法 来 说 ， 后 置 条 件 是 那些 方法 被 调用 之 后 所 要 保持 的 条 件 (只 要 先决 条 件 
满足 )。 对 于 我 们 的 addHeader 〇 来 说 ， 后 置 条 件 是 headers map 的 大 小 比 原来 增 大 一 个 。 


不 变量 ”对象 的 不 变量 是 那些 只 要 在 方法 被 调用 之 前 它 的 先决 条 件 被 满足 就 始终 为 真 的 数 
据 。 例 如 ， 链 表 在 缓存 中 的 长 度 总 是 和 列表 的 长 度 是 一 样 的 。 


实现 一 个 类 时 只 要 总 按照 上 面 这 三 条 编写 断言 , 你 的 软件 就 会 自动 检测 大 量 可 能 存在 的 各 类 
缺陷 。 


10.1.5 ”开启 或 关闭 断言 
我 们 刚刚 提 及 的 断言 的 一 个 关键 方面 就 是 它们 可 以 被 禁用 。 通常 情况 下 我 们 在 开发 阶段 和 调 


© 请 注意 HTTP 规范 -我 知道 有 些 时 候 ， 头 信息 可 以 合法 地 出 现 一 次 以 上 。 但 它们 总 是 被 能 够 联结 值 的 单个 头 信 
息 所 代替 ， 而 对 于 一 个 简单 的 例子 ， 我 选择 忽略 这 种 微妙 的 差异 。 
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试 阶段 会 启用 断言 功能 ， 但 是 在 产品 阶段 时 我 们 会 禁用 断言 功能 。 


在 Java 中 ， 当 启动 应 用 程序 时 ,我们 可 以 在 Java 命令 行 中 使 用 如 下 的 参数 来 开启 或 关闭 断 
言 功 能 : 


-ea[:<packagename>...|:<classname>] 
-enableassertions[:<packagename>...|:<classname>] 
enable assertions 
-da[:<packagename>...|:<classname>] 
-disableassertions[:<packagename>...|:<classname>] 
disable assertions 
-esa | -enablesystemassertions 
enable system assertions 
-dsa | -disablesystemassertions 
disable system assertions 


在 其 他 的 编程 语言 中 , 会 有 另 一 些 机 制 来 启用 和 禁用 断言 功能 。 例 如 在 C 和 C++ 中 , 我 们 在 
构建 时 使 用 条 件 编译 来 开关 断言 。 


为 什么 我 们 要 选择 关闭 断言 功能 ? 有 两 方面 的 原因 一 一 效率 和 和 鲁 棒 性 。 


断言 的 求 值 很 花费 时 间 ， 而 且 对 于 程序 的 功能 没有 任何 贡献 。( 总 之 ， 如 果 程序 正确 运行 ， 那 
么 断言 将 不 会 起 到 任何 作用 。) 如 果断 言 位 于 性 能 十 分 关键 的 环节 中 或 者 条 件 的 求 值 需 要 一 些 时 间 
( 想 想 我 们 之 前 的 例子 ， 断 言 参与 解析 HITP 消息 是 否 格式 良好 )， 那 么 它 有 可 能 影响 性 能 。 


然而 ,不 执行 断言 的 一 个 更 重要 的 原因 是 鲁 棒 性 。 如 果断 言 失败 了 ,软件 将 会 随意 地 退出 并 
弹出 一 个 简短 的 而 且 (对 最 终 用 户 而 言 ) 没有 帮助 的 信息 。 或 者 说 如 果 我 们 的 程序 是 一 个 长 时 间 
运行 的 服务 器 , 一 个 失败 的 断言 没有 处 理 完 就 会 杀 死 服务 器 进程 , 谁 也 不 知道 留 下 的 数据 是 什么 
东西 。 虽 然 在 我 们 开发 和 调试 错误 时 这 些 问 题 是 可 以 接受 的 (事实 上 也 是 想 让 它 发 生 的 )， 但 是 
这 肯定 不 是 我 们 在 产品 阶段 想 看 到 的 。 

相反 ， 产 品级 软件 应 该 根据 实际 情况 编写 容错 性 或 者 是 故障 安全 机 制 。 如 何 去 实 现 这 个 目标 
不 是 这 本 书 所 要 讲述 的 内 容 ， 但 是 这 确实 给 我 们 带 来 了 防 错 性 程序 设计 这 个 琼 手 的 课题 。 


10.1.6 ” 防 错 性 程序 设计 


欣 谷 在 产品 阶段 应 该 是 午 防 错 性 程序 设计 是 软件 开发 中 一 个 重要 的 且 对 于 不 
富阳 而 在 调试 阶段 应 谍 星 胰 ” 同 的 人 拥有 不 同 的 含义 的 术语 。 我 们 现在 谈论 的 是 通过 编 
Be, 写 运行 正确 (看 我 们 如 何 定义 正确 ) 的 代码 来 实现 小 规模 


Software should be robust 容错 的 常见 做 法 。 
in production and fragile when 
debugging . 但 是 防 错 性 程序 设计 是 一 把 双 刃 剑 一 一 从 调试 错误 
a a ae are EE om RI Me EF 
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的 角度 来 看 ， 它 令 我 们 的 工作 非常 困难 。 它 把 原来 简单 的 、 显 而 易 见 的 缺陷 转变 成 蜂 涩 的 、 难 以 
检测 的 缺陷 ， 而 且 诊 断 起 来 非常 困难 。 我 们 希望 软件 在 产品 阶段 越 健壮 越 好 ， 但 是 调试 脆弱 的 软 
件 更 加 容易 ， 因 为 当 缺 陷 出 现 的 时 候 它 会 立即 表现 出 来 。 


一 个 很 常见 的 例子 就 是 无 处 不 在 的 For 循环 ， 我 们 一 般 不 用 下 面 这 种 写法 : 


for (i = 0; i != iteration_count; ++i) 
«Body of loop» 


我 们 应 该 书写 成 下 面 这 种 防 错 性 版 本 : 


for (i = 0; i < iteration_count; ++i) 
«Body of loop» 


在 几乎 所 有 的 例子 中 , 所 有 的 循环 行为 都 一 样 , 迭代 从 0 开始 到 iteration_count-1, 因此 ， 
为 什么 我 们 许多 人 都 很 自然 地 编写 第 二 种 格式 的 循环 而 不 是 第 一 种 呢 ? © 


原因 是 如 果 循 环 体 分 配给 变量 i 的 值 大 于 iteration_count， 第 一 种 写法 将 不 会 停止 循环 。 
在 测试 中 通过 使 用 < 替代 !=， 我 们 可 以 确认 实际 发 生 这 种 情况 时 循环 是 会 终止 的 。 


这 个 问题 在 于 如 果 循 环 的 索引 确实 大 于 iteration_count, 极 有 可 能 意味 着 代码 中 有 缺陷 。 而 
在 第 一 个 版 本 的 代码 中 ， 我 们 会 立即 注意 到 它 确实 有 缺陷 (因为 程序 里 有 一 个 死 循环 ) ， 现 在 换 成 
第 二 个 版 本 它 就 一 点 儿 也 不 明显 了 。 以 后 它 很 有 可 能 让 我 们 吃苦 头 ， 而 且 非 常 难以 诊断 。. 


再 来 看 另 一 个 例子 ， 想 象 一 下 我 们 编写 了 一 个 函数 ， 它 包含 一 个 字符 串 类 型 的 参数 ， 如 果 这 
个 字符 串 全 部 是 大 写 就 返回 真 ， 否 则 返回 假 。 这 是 在 Java 中 一 种 可 能 的 实现 方式 : 
public static boolean allUpper(String s) { 
CharacterIterator i = new StringCharacterIterator(s); 


for (char c = i.first(); c != CharacterIterator.DONE; c = i.next()) 
if (Character. isLowerCase(c)) 
return false; 


return true; 


} 
这 是 一 个 十 分 合理 的 函数 一 但 是 由 于 某 种 原因 我 们 将 nu11 作为 参数 传递 给 这 个 函数 ， 我 
们 的 软件 将 会 崩溃 。 为 避免 这 种 情况 发 生 ， 一 些 开发 者 可 能 会 在 代码 的 开头 添加 一 些 代 码 : 


if (s == null) 
return false; 


那么 ， 现 在 程序 不 会 崩溃 了 一 一 但 是 当 程 序 调用 函数 的 时 候 传 进 一 个 空 字符 串 是 什么 意思 


@ 事实 上 ， 由 于 标准 模板 程式 库 的 存在 这 种 写法 在 C ++ 社 区 中 是 不 受 欢迎 的 ， 但 是 事实 上 的 例子 不 可 胜 数 。 
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WE? 很 有 可 能 任何 这 样 做 的 代码 都 包含 有 缺陷 ， 但 现在 我 们 将 它 掩盖 过 去 了 。 


断言 给 我 们 提供 了 一 个 非常 简单 的 解决 方法 。 无论 你 在 哪里 写 防 错 性 代码 , 都 要 确保 使 用 断 
言 保护 这 段 代码 。 


因此 ,现在 位 于 al1Upper 〇 开头 的 防 错 性 代码 变 成 如 下 形式 .: 


assert s != null : "Null string passed to allUpper"; 
if (s == null) 
return false; 


同时 我 们 早先 的 For 循环 的 代码 变 成 下 面 这 个 样子 : 


for Ci = 0; i < iteration_count; ++i) 
«Body of loop» 
assert i == iteration_count; 


我 们 现在 一 举 两 得 一 一 鲁 棒 的 产品 软件 和 胸 弱 的 开发 /调试 软件 。 


断言 和 语言 文化 

一 种 编程 语言 不 仅仅 是 语法 和 语义 。 每 一 种 语言 周围 都 环绕 着 一 个 甚至 几 个 社区 ,形成 
了 自己 的 惯用 方法 、 规 范 和 实践 。 某 种 语言 中 是 否 使 用 断言 或 者 如 何 习惯 性 地 使 用 在 一 定 程 
度 上 取决 于 社区 的 习惯 。 


虽然 断言 可 以 用 在 任何 语言 ， 但 是 它 更 广泛 地 应 用 在 C/C++ 的 社区 中 。 断 言 在 Java 中 
使 用 不 广 ， 可 能 是 因为 它们 直到 Java 1.4 才 被 官方 支持 。 (虽然 种 种 迹象 表明 ， 由 于 基于 Java 


虚拟 机 的 语言 如 Groovy 和 Scala 的 推波助澜 ， 断 言 在 Java 社 区 应 用 日 益 广泛 。) 


还 有 一 部 分 原因 可 能 是 在 C/C++ 中 代码 出 错 的 可 能 性 更 高 。 指 针 使 用 不 当 会 出 问题 ， 
字符 事 和 其 他 数据 结构 会 溢出 ,而 这 些 问 题 不 可 能 出 现在 Java 和 Ruby 这 样 的 编程 语言 当 
Pe 

但 是 这 并 不 意味 着 断言 在 这 些 语言 当中 没有 价值 一 一 仅仅 是 说 明 我 们 并 不 需要 在 这 些 
语言 中 使 用 断言 来 检查 这 种 低级 的 错误 。 在 高 级 的 问题 检测 当中 断言 仍然 是 极为 有 价值 的 。 





10.1.7 ”断言 滥用 


和 很 多 其 他 工具 一 样 , 断言 可 能 被 滥用 。 你 需要 避免 两 个 常见 错误 一 -使 用 断言 的 副作用 和 
使 用 断言 来 检测 错误 而 不 是 缺陷 。 


将 你 的 思绪 拉 回 到 我 们 的 HttpMessage 类 上 面 来 , 然后 想象 一 下 我 们 要 实现 一 个 方法 , 用 它 
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来 移 除 之 前 我 们 添加 的 头 信 息 。 如 果 想 要 断言 它 总 带 着 已 有 的 头 信 息 被 调用 , 我 们 可 能 会 用 如 下 
的 实现 方法 (如 果 键 不 存在 ， 那 么 Java 的 remove() 方 法 将 返回 null); 


public void removeHeader(String name) { 
assert headers.remove(name) != null; 


} 
这 段 代码 的 问题 是 断言 有 副作用 。 如 果 我 们 在 运行 代码 的 时 候 不 启用 断言 ,那么 它 就 不 能 被 
正确 地 执行 ， 因 为 只 要 去 掉 对 nu11 的 检查 ， 我 们 就 相当 于 移 除 掉 对 remove() 方 法 的 调用 了 。 


更 好 的 书写 规范 是 像 下 面 这 个 样子 (也 有 更 好 的 自我 记录 ): 


assert headers.containsKeyCname) ; 
headers. remove(name) ; 


断言 的 一 个 任务 是 检查 代码 是 否 按照 其 应 该 运行 的 方式 去 运行 ， 而 不 是 影响 代码 运行 的 方 
式 。 由 于 这 个 原因 , 测试 断言 执行 还 是 不 执行 的 情况 是 非常 必要 的 。 如 果 副 作用 已 经 悄悄 产生 了 ， 
那么 你 一 定 想 先 于 用 户 找到 它们 。 


断言 是 一 个 缺陷 检测 机 制 ， 不 是 一 个 错误 处 理 机 制 。 “一 疡 玉 不 证 二 个 习 六 次 天 视 ” 
这 有 什么 区 别 ? 错误 是 不 受 欢迎 的 ， 但 是 它们 可 以 出 现在 He 
零 缺 陷 的 代码 中 ， 而 如 果 代 码 按照 预期 运行 的 话 ， 缺 陷 是 LE are. not on TT 
不 可 能 出 现 的 。 下 面 这 些 例子 几乎 可 以 肯定 是 不 应 该 使 用 从 mechanism: 
断言 来 处 理 的 


口 试图 打开 一 个 文件 却 发 现 它 并 不 存在 
口 通过 网 络 连接 检测 和 处 理 无 效 的 数据 
a 当 写 入 文件 时 空间 已 用 完 

O 网 络 错误 


错误 处 理 机 制 〈 如 使 用 异常 或 者 错误 代码 ) 才 是 处 理 这 些 情况 的 正确 方法 。 
我 们 已 经 提 到 在 产品 版 本 中 断言 通常 是 被 禁用 的 ， 而 在 开发 版 本 或 者 调试 版 本 中 是 启用 的 。 
但 是 到 底 什么 是 调试 版 本 呢 ? 


10.2 ”调试 版 本 


许多 团队 发 现 调试 版 本 是 非常 有 帮助 的 , 在 帮助 我 们 重 现 问题 和 诊断 问题 的 很 多 方式 上 , 调 
试 版 本 不 同 于 发 布 版 本 。 
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W 小 乔 爱问 
妆 ”难道 调试 版 本 不 是 不 同 的 吗 


编译 器 的 编写 者 竭尽 全 力 保证 , 关闭 最 优化 功能 或 者 打开 额外 的 检查 并 不 改变 软件 的 运 


行 行为 。 如 果 你 章 欢 感觉 好 一 些 ， 编 写 断言 和 日 志 时 也 可 以 这 么 做 。 


但 是 其 实 调试 版 本 不 同 于 产品 版 本 。 在 大 多 数 的 时 候 这 无 关 紧要 ， 但 是 请 谦 记 在 心 。 如 
果 你 在 调试 版 本 中 重 现 问题 时 遇 到 麻烦 ， 那么 请 用 产品 版 本 代替 调试 版 本 。 





10.2.1 编译 器 选项 


许多 编译 器 给 你 提供 了 大 量 的 选项 , 允许 你 精确 地 控制 如 何 将 源 代码 编译 成 目标 代码 。 在 开 
发 调试 阶段 和 产品 阶段 对 编译 器 进行 不 一 样 的 设置 是 比较 合理 的 。 下 面 是 一 些 例子 。 


优化 ”现代 的 编译 器 取得 了 惊人 的 成 就 ， 生 成 的 目标 代码 比 手工 编写 机 器 代码 更 有 效率 、 
更 好 。 然 而 , 在 生成 目标 代码 的 过 程 中 ， 编 译 器 会 经 常 重新 组 织 代 码 结构 ， 以 至 于 源 代码 和 目标 
代码 之 间 的 关系 变 得 越 来 越 模糊 。 例 如 , 这 样 做 将 会 使 在 调试 器 中 进行 单 步调 试 变 得 没有 头绪 甚 
至 不 可 能 。 结 果 ， 调 试 版 本 使 得 我 们 无 法 进行 优化 。 


调试 信息 ”为 了 能 在 源 代码 中 进行 单 步调 试 ， 调 试 人 员 必 须知 道 如 何 将 源 代 码 所 在 位 置 与 
目标 代码 的 相应 区 域 建立 起 映射 。 通常 这 些 都 被 排除 在 生产 版 本 之 外 , 因为 它们 会 增加 程序 的 大 
小 并 可 能 会 泄露 一 些 我 们 不 愿 透露 的 信息 。 


边界 检查 ”一些 C/C++ 的 编译 器 提供 对 数组 和 一 些 其 他 的 数据 结构 进行 边界 检查 的 功能 。 
但 是 调试 版 本 不 仅仅 是 选择 不 同 的 编译 器 选项 。 


10.2.2 ”调试 子 系统 


有 些 时 候 值 得 我 们 去 考虑 特别 设计 一 个 版 本 来 替换 整个 子 系统 ,使 调试 更 加 容易 。 如 果 我 们 
不 能 很 容易 地 控制 子 系统 的 产品 版 的 行为 (例如 它 在 第 三 方 的 控制 下 , 或 者 它 的 运行 中 涉及 一 些 
随机 元 素 )， 那 么 这 种 方法 将 会 特别 有 用 。 

例如 ,设想 我 们 的 软件 接口 采用 了 第 三 方 提供 的 服务 器 ， 我们 正在 试图 调试 一 个 问题 ,这 个 
问题 只 有 当 这 个 服务 器 返回 一 个 特定 的 结果 序列 的 时 候 才 会 发 生 。 我 们 不 会 很 容易 甚至 不 可 能 找 
到 一 种 方法 来 确定 它 总 能 确切 地 返回 一 个 满足 需求 的 序列 。 就 算 可 以 , 它 的 拥有 者 也 不 会 因为 我 
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们 向 服务 器 发 出 大 量 请 求 而 感谢 我 们 一 一 特别 是 这 些 请 求 如 果 没 有 很 好 的 格式 (这 很 可 能 是 调试 
过 程 中 的 情况 )。 


调试 子 系统 与 我 们 在 9.1 节 讨 论 过 的 代替 测试 技术 之 间 是 有 重 又 的 。 所 不 同 的 是 规模 和 范围 。 
代替 测试 技术 是 一 个 短 生 命 周期 的 对 象 , 仅仅 用 于 单一 测试 。 调试 子 系统 通常 是 用 来 完全 替代 其 
对 应 的 产品 子 系统 的 ， 它 实现 了 所 有 的 接口 并 且 在 广泛 的 用 例 中 正确 地 运行 。 对 于 我 们 来 说 ， 可 
能 通过 软件 发 布 调试 子 系统 更 有 意义 , 这 样 使 得 终端 用 户 可 以 有 能 力 在 现场 有 序 地 帮助 我 们 调试 
问题 。 


调试 子 系统 可 以 完全 取代 相应 的 产品 系统 (模仿 它 的 整个 行为 )， 或 者 将 它 当 作 软 件 其 他 部 
分 和 产品 系统 的 中 介 来 实施 ， 适 当地 修改 其 行为 。 


在 调试 期 间 ， 你 可 能 会 考虑 绕 过 一 个 特殊 的 用 户 接口 子 系统 。 
1. 解决 用 户 界面 问题 


终端 用 户 的 需求 和 开发 者 的 需求 是 非常 不 一 样 的 。 一 个 图 形 界面 或 者 基于 网 络 的 用 户 界面 可 
能 会 使 终端 用 户 很 容易 完成 他 们 的 目标 , 但 是 在 开发 和 调试 阶段 却 会 带 来 麻烦 ， 因 为 这 样 的 用 户 
界面 从 编程 的 角度 来 说 将 会 非常 难以 控制 。 


同样 的 一 般 原则 一 一 有 的 时 候 对 于 软件 来 说 , 开发 和 调试 阶段 与 产品 阶段 的 运行 有 所 不 
同一 一 也 是 适用 的 ， 无 论 是 拿 什 么 语言 编写 ， 无 论语 言 是 编译 型 的 还 是 解释 型 的 。 但 是 ， 假 
使 条 件 编译 不 能 作为 一 个 选项 , 这 个 机 制 对 于 解释 性 语言 来 说 要 达到 目的 也 只 有 在 运行 时 才 
能 实现 。 





因为 这 个 原因 (也 有 其 他 原因 )， 确 保 用 户 界面 层 尽 可 能 地 小 是 有 道理 的 ， 仅 仅 是 照顾 显示 
信息 的 细节 和 征求 用 户 的 输入 就 可 以 了 。 尤 其 它 不 应 该 包含 任何 业务 逻辑 。 这 意味 着 你 可 以 选择 
一 个 代替 品 ， 比 如 脚本 语言 ， 来 驱动 余下 的 软件 ， 从 调试 立场 上 看 这 更 加 容易 。 

如 果 你 的 软件 实现 了 一 个 对 象 建 模 ， 例 如 在 Windows 下 的 (OLE) 自动 化 或 者 Mac 电脑 支 
持 的 AppleScript， 那 就 更 是 如 鱼 得 水 了 。 甚 至 值得 专 为 调试 增加 这 样 一 个 对 象 模型 的 支持 。 


另 一 个 通常 被 调试 版 本 所 替代 的 子 系统 是 内 存 分 配器 。 
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2. 调试 内 存 分 配器 


在 C 和 C++ 这 样 的 语言 中 , 不 提供 自动 化 内 存 管理 机 制 , 因此 一 个 调试 内 存 分 配器 是 非常 有 
价值 的 。 调 试 分 配器 可 以 帮助 你 检测 和 解决 很 多 常见 的 问题 。 


O 通过 跟踪 内 存 的 分 配 和 释放 ， 可 以 检测 内 存 泄 露 (内存 被 分 配 但 是 没有 被 释放 )。 

Q 在 分 配 的 内 存 前 后 放置 保护 器 ， 可 以 检测 缓冲 区 溢出 和 内存 损坏 。 

O 通过 用 已 知 模式 填充 内 存 区 ， 可 以 检测 哪个 实例 使 用 的 内 存 没 有 被 初始 化 。 

口 通过 使 用 已 知 的 模式 填充 已 释放 的 内 存 并 让 其 常 驻 ， 可 以 检测 内 存 后 又 被 写 和 的 实例 。 







内 存 完 整 性 检查 器 


一 | 
调试 内 存 分 配器 需要 你 对 目标 代码 进行 修改 才能 使 用 。 内存 完 整 性 检查 器 是 通过 使 用 进 | 
程 的 虚拟 内 存 结 构 来 对 任何 程序 进行 类 似 分 析 的 工具 。 | 


就 个 人 而 言 ,我 比较 倾向 于 使 用 调试 分 配器 ， 因 为 通常 其 工作 层级 更 为 细 颗 粒 化 ， 可 能 | 


给 你 更 多 的 控制 和 洞察 力 。 但 是 完整 性 检查 器 在 你 调试 存在 于 产品 版 本 的 缺陷 或 者 调试 遗留 
应 用 程序 时 更 加 有 用 的 。 


附录 A.4 中 列 出 了 这 些 工 具 。 | 
ed 


调试 分 配器 列表 可 以 参看 附录 A.3。 
10.23 内置 控制 


我 们 在 修改 第 三 方 代码 的 同时 , 也 可 以 选择 让 我 们 自己 的 代码 不 同 于 调试 版 本 , 在 诊断 中 内 
置 控 制 将 会 非常 有 用 。 有 如 下 一 些 例子 。 


禁用 功能 “有 时 候 你 的 软件 包含 的 一 些 功能 对 于 产品 来 说 是 非常 有 用 的 ， 但 是 在 调试 中 却 
让 人 感到 困惑 。 例 如 ， 由 于 安全 原因 ， 应 用 程序 的 一 部 分 与 另 一 部 分 进行 的 通信 可 能 会 被 加 密 。 
或 者 为 了 提高 内 存 利用 率 和 执行 速度 ， 数 据 结构 可 能 被 优化 。 如 果 你 选择 性 地 禁用 这 些 功 能 , 那 
么 对 这 些 代码 区 域 的 问题 进行 诊断 时 可 能 会 简单 一 些 。 


提供 其 他 实现 ”有 时 实现 一 个 模型 的 方法 不 止 一 种 一 一 一 种 是 简单 且 容 易 理 解 的， 而 另 一 
种 则 是 复杂 且 难 理解 的 。 通过 包含 这 两 种 代码 并 提供 互相 转换 的 方法 , 你 可 以 证 实 哪 种 版 本 的 结 
果 是 对 的 。 这 可 以 帮助 你 查 明 错 误 是 存在 于 简化 的 版 本 当中 还 是 其 他 地 方 , 就 算 错误 在 其 他 地 方 ， 
它 也 可 以 帮 你 更 好 地 理解 问题 。 
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虽然 我 们 试图 讨论 调试 和 发 布 两 个 不 同 版 本 , 但 是 这 也 不 能 阻挡 你 构建 其 他 版 本 。 例如 一 些 
团队 ,在 调试 版 本 和 发 布 版 本 中 间 编 写 一 个 半成品 的 集成 版 本 。 它 可 能 启用 调试 标记 和 断言 的 功 
能 使 它 看 起 来 像 调 试 版 本 ,但 是 它 也 拥有 优化 功能 使 它 看 起 来 像 发 布 版 本 。 
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尽 你 所 能 尽早 地 发 现 错误 而 不 是 等 到 它们 在 成 品 阶段 才 浮现 出 来 , 这 个 观点 很 对 。 尤 其 对 于 
某 类 问题 来 说 ， 这 更 是 颠 扑 不 破 的 真理 ， 最 具 代 表 性 的 要 数 资 源 泄漏 和 异常 处 理 缺 陷 了 。 


这 些 问 是 往往 是 相关 的 (资源 泄 汤 经 常 是 由 于 不 正确 一 不 二 布下 天 天 二 天 本 丽人 
的 异常 处 理 而 产生 的 ) 和 系统 性 的 。 如 果 你 在 一 个 地 方 犯 “来 一 一 六 动 县 尽早 仙 检测 宅 但。 
错误 ， 那 么 有 可 能 在 其 他 地 方 也 犯 相同 的 错误 。 等 到 问 是 Don’t wait for resource 


暴露 出 来 , 你 会 发 现 面 对 的 是 一 个 艰巨 的 任务 一 到 那 时 ， teaks to manifest — detect them 
代码 会 漏洞 百出 automatically and early. 


令 人 高 兴 的 是 ， 这 两 个 问题 都 可 以 自动 检测 到 。 在 这 一 节 ， 我 们 将 看 到 一 个 用 C++ 编写 的 例 
子 是 如 何 来 做 的 ， 同 样 的 基本 方法 也 适用 于 任何 其 他 语言 。 


10.3.1 在 测试 中 自动 抛 出 异常 


该 方法 是 建立 在 两 个 被 广泛 使 用 的 工具 之 上 的 一 一 一 个 调试 内 存 分 配器 和 一 个 单元 测试 框 
架 。 我们 将 创建 一 个 我 们 自己 的 非常 简单 的 单元 测试 框架 ,用 它 来 添加 一 个 新 的 功能 ， 即 指出 什 
么 时 候 可 能 会 抛 出 一 个 异常 。 每 一 个 测试 都 要 运行 很 多 次 。 第 一 次 是 正常 运行 , 这 时 测试 框架 只 
是 记录 会 抛 出 哪些 异常 。 然 后 再 次 针对 每 个 异常 运行 ， 重 新 抛 出 这 个 异常 。 


这 个 方法 对 于 任何 可 能 抛 出 异常 的 地 方 都 非常 有 用 ， 但 是 有 一 个 特别 的 地 方 非常 适合 使 用 这 种 
方法 一 一 无 论 内 存 何 时 被 分 配 。 我 们 的 例子 重 载 了 全 局 函数 operator new() Fil operator 
delete()， 见 如 下 代码 : 


void» operator new(size_t size) { 
o TEST_ERROR(bad_alloc()); 
void «p = malloc(size); 
if(!p) 
throw bad_alloc(); 
return p; 


} 


void operator delete(void +p) { 
free(p); 
} 


134 P 第 10 章 让 软件 学 会 自己 寻找 缺陷 


这 段 代 码 的 关键 在 于 调用 行 @ 的 TEST_ERRORO 代码， 这 段 代 码 让 测试 框架 知道 operator 
new() 可 能 会 抛 出 一 个 bad_alloc 异常 。 稍 后 我 们 将 会 看 到 TESTERRORO 函数 的 实现 。 现 在 , 让 
我 们 看 看 这 段 代码 是 如 何 帮 有 我 们 调试 异常 处 理 的 。 


10.3.2 一 个 例子 
假定 我 们 正在 编写 一 个 用 来 实现 简单 二 又 树 的 类 。 这 是 第 一 次 尝试 


class TreeNode { 
public: 
TreeNode(int value) : m_value(value), m left(0), m_right(0) {} 
~TreeNode() { 
delete m_left; 
delete m_right; 
} 


int value() const { return m_value; } 
TreeNode* left() const { return m_left; } 
TreeNode* right() const { return m_right; } 


void setLeft(TreeNode* left) { m_left = left; } 
void setRight(TreeNode* right) { m_right = right; } 


private: 
int m_value; 
TreeNode* m_left; 
TreeNode* m_right; 
J; l 
这 个 实现 本 身 是 非常 简单 的 一 一 每 一 个 TreeNode 都 有 个 整数 值 ， 还 包含 它 的 左右 子 树 的 指 
针 。 我 们 用 了 一 些 简单 的 获取 和 设置 函数 就 成 功 实现 了 。 


通过 创建 一 个 简单 的 测试 函数 ， 我 们 可 以 测试 代码 是 不 是 按照 期 望 的 那样 运行 : 


void testTree() { 
auto_ptr<TreeNode> root(new TreeNode(42)); 
assert(!root->left()); 
assert(!root->right()); 


root->setLeft(new TreeNode(10)); 
assert(root->left()->value() == 10); 
assert(!root->rightQ)); 


root->setRight(mew TreeNode(20)) ; 
assert(root->left()->value() == 10); 
assert(root->right()->value() == 20); 
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上 面 这 段 代码 的 运行 结果 如 下 : 


Running test: testTree 
exception run: 1 
exception run: 2 
exception run: 3 


总 之 , 测试 运行 了 4 次 : 第 一 次 是 “正常 ”运行 , 后面 三 次 运行 每 次 都 进行 一 次 内 存 的 再 分 配 。 


到 目前 为 止 ， 一 切 良 好 。 现 在 ， 让 我 们 更 进一步 ， 实 现 一 个 copyQ 〇 方法 用 来 复制 整个 树 。 
这 应 该 不 很 难 ， 是 吧 ? 


TreeNode* copyQ { 
TreeNodex node = new TreeNode(m_value); 
if(m_left) 
node->m_left = m_left->copy(); 
if(m_right) 
node->m_right = m_right->copy(Q); 
return node; 


3 
看 起 来 够 简单 。 


让 我 们 看 看 在 结束 测试 时 添加 调用 这 个 函数 以 后 出 现 的 结果 吧 ， 


Running test: testTree 
exception run: 1 
exception run: 
exception run: 
exception run: 
exception run: 

Memory leaks found during test: testTree(5) 

0 bytes in 0 Free Blocks. 

12 bytes in 1 Normal Blocks. 

0 bytes in 0 CRT Blocks. 

0 bytes in 0 Ignore Blocks. 

0 bytes in 0 Client Blocks. 

Largest number used: 0 bytes. 

Total allocations: 48 bytes. 
exception run: 6 

Memory leaks found during test: testTree(6) 

0 bytes in 0 Free Blocks. 

24 bytes in 2 Normal Blocks. 

0 bytes in 0 CRT Blocks. 

0 bytes in 0 Ignore Blocks. 

0 bytes in 0 Client Blocks. 

Largest number used: 0 bytes. 

Total allocations: 60 bytes. 


我 想 实现 一 个 异常 安全 版 本 的 copy() 并 不 像 看 起 来 的 那么 容易 。 


wm 上 mw 
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当然 ， 这 个 问题 是 如 果 一 次 递归 调用 copyO 〇 会 抛 出 一 个 异常 ， 那 么 在 方法 的 起 始 处 被 分 配 
的 节点 就 没有 被 删除 。 为 了 保持 完整 性 ， 这 里 有 一 种 修复 方法 ， 就 是 使 用 auto_ptr 函数 : 


TreeNode* copyFixed() { 
auto_ptr<TreeNode> node(new TreeNode(m_value)); 
if(m_left) 
node->m_left = m_left->copyFixed(); 
if(m_right) 
node->m_right = m_right->copyFixed(); 
return node.release(); 


} 


10.3.3 ”测试 框架 


因此 ， 测 试 框架 怎样 才能 知道 需要 运行 多 少 次 测试 ， 还 会 抛 出 哪些 异常 呢 ? 框架 的 核心 是 
Test 类 ， 它 的 每 一 个 实例 代表 一 个 测试 。 


由 于 目前 出 现 了 虚拟 内 存 技 术 , 内 存 用 尽 不 再 是 一 个 问题 。 那 么 ,为 什么 要 去 费劲 测试 
抛 出 的 bad_alloc HHA? 既然 这 个 问题 在 实际 中 从 不 发 生 。 


问题 的 关键 不 是 检查 当 内 存 用 尽 时 代码 如 何 处 理 〈 虽 然 这 是 一 个 附带 的 好 处 ) 。 关 键 是 
检查 代码 是 不 是 异常 安全 的 。 因 为 大 部 分 的 C++ 程序 都 会 经 常 地 分 配 内 存 , 检查 我 们 能 够 处 
理 bad_alloc 函数 是 一 个 非常 好 的 运行 大 量 可 能 的 异常 处 理 路 径 的 方法 。 


编写 异常 安全 的 C+ 代码 是 很 难 的 一 一 要 比 它 最 初 看 起 来 的 困难 很 多 。 对 于 所 涉及 的 一 
些 非常 精彩 的 细节 讨论 ， 请 看 Herb Sutter 编写 的 Exceptional C++(Sut99)。 





class Test { 

public: 
Test(const chars name, void (*testFunction) ()); 
~TestQ; 


void run(); 
static bool testError(); 


private: 
const char» m_name; 
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void (*m_testFunction)(); 
void runiInternal(Q); 


// Count of errors that can be triggered 
static int m_errorCount; 
static int m_throwOnError; 

}; 


Test 包括 两 个 静态 变量 , m_errorCount 和 m_throwOnError。 有 关 这 些 变量 是 如 何 控制 测试 


类 执行 的 ， 可 以 参看 图 10-1。 在 “正常 ”测试 运行 的 时 候 ，m_throwOnError 被 设置 为 0， 然 后 
每 调用 一 次 TEST_ERROR(),m_errorCount 的 值 就 加 1。 


正常 测试 执行 
(m_throwOnError == 0) 


TEST_ERROR ---> m_errorCount == 1 


TEST_ERROR ---® m_errorCount == 


TEST_ERROR ---> m_errorCount == 


异常 运行 1 异常 运行 2 异常 运行 3 
(m_throwOnError == 1) (m_throwOnError == 2) 。 (m_throwOnError == 3) 
— Ze FeaT ERANA : 

AESI ERROR == TEST ERROR TEST ERROR 


TEST_ERROR == TEST_ERROR TEST_ERROR 


z Az 
== TEST_ERROR 三 一 
= 





图 10-1 运行 中 的 TEST_ERRORO 


在 异常 运行 时 ，m_throwOnError 意味 着 TEST_ERRORQO 的 哪 一 个 实例 需要 抛 出 。 我 们 的 
TEST_ERRORC) 宏 仅仅 是 调用 TEST: :testError()， 如 果 它 的 返回 值 为 真 ， 那 么 就 抛 出 一 个 异 
常 。 


#define TEST_ERROR(e) \ 
if(Test::testErrorQ)) \ 
throw e; 
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反 过 来 ， 所 有 的 testError 〇 方法 运行 结果 追踪 我 们 遇 到 了 多 少 个 可 能 的 异常 ， 如 果 异 常 的 
数量 达到 m_throwOnError 显示 的 值 ， 那 么 返回 值 就 为 真 。 


bool Test::testError() { 
++m_errorCount; 
return m_errorCount == m_throwOnError; 


} 
这 个 是 run() 方 法 运行 的 一 个 测试 《有 点 让 人 吃惊 ) ; 


void Test::run(Q) { 
cout << "Running test: 
o m_throwOnError = 0; 
runInternal(); 


" 


<< m_name << endl; 


@ int additionalTestRuns = m_errorCount; 
© for(int i = 1; i <= additionalTestRuns; ++i) { 
cout << " exception run: " << i << endl; 


m_throwOnError = i; 
runinternal(); 
} 
} 


O Test: :runO 〇 开始 于 调用 runInternal (O, 并 将 mthrowOnError 变量 设置 为 0 来 确保 
testError 人 方法 总 返回 假 。 


四 在 runInternal0) 运 行 完成 以 后 ，m_errorCount 变量 是 我 们 在 进行 复制 操作 时 这 部 分 测 
试 可 能 会 抛 出 异常 的 次 数 。 


@ 然后 在 每 一 次 可 能 的 异常 出 现时 调用 一 次 runiInternalQ, ， 并 将 m_throwOnError 设置 成 
我 们 这 次 想 要 抛 出 的 异常 的 编号 。 


最 后 在 检测 完 内 存 泄露 和 不 可 预计 的 异常 打包 检测 以 后 , 用 runInternal1() 方 法 简单 地 调用 
测试 。 
void Test::runInternalQ { 


m_errorCount = 0; 
takeMemorySnapshot() ; 


try { 
(*m_testFunction) (); 
} catch(exception& e) { 
// An unhandled exception is only a problem if this is a normal 
// run - we expect unhandled exceptions during error simulation 
if(m_throwOnError == 0) 
cerr << "Unhandled exception in test: 
e.what() << endl; 


" << mname << "\n" << 
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reportMemoryLeaks(); 


} 
因此 ， 最 后 你 将 得 到 的 是 完全 自动 检测 内 存 泄 露 和 异常 非 安全 的 代码 。 不 是 这 样 吗 ? 


10.4” 付 诸 行 动 


口 使 用 断言 来 做 下 面 的 事 : 

里 记录 和 自动 验证 假设 ， 

里 虽然 在 产品 发 布 的 时 候 要 有 鲁 棒 性 ， 但 在 调试 期 间 要 确保 软件 是 脆弱 的 。 
n 创建 这 样 的 一 个 调试 版 本 : 

m 以 调试 友好 的 方式 进行 编译 ， 

n 允许 关键 子 系统 被 等 价 的 调试 代码 取代 ， 

n 内 典 在 诊断 阶段 非常 有 用 的 可 控 性 。 
9 在 问题 出 现 之 前 抢先 检测 系统 问题 ， 例 如 资源 泄露 和 异常 处 理 问题 。 


第 了 了 章 
B Ë xt 


我 们 都 熟悉 模式 ， 它 用 来 解决 常见 的 、 反 复出 现 的 问题 。 

反 模 式 是 一 种 另类 的 模式 ， 指 我 们 反复 犯 的 一 些 常见 错误 。 有 时 候 ， 它 们 貌似 很 好 的 解决 
方案 , 但 在 实践 中 却 行 不 通 。 有 些 我 们 明知 道 它们 不 是 解决 问题 的 好 方法 , 但 却 都 在 使 用 它们 。 

有 备 方 能 无 患 ， 了 解 反 模 式 是 避免 发 生 错误 的 第 一 步 。 


11.1 夸大 优先 级 


我 早年 所 在 的 团队 遇 到 一 个 问题 。 作 为 惯用 的 方法 〈 至 今 仍 如 此 ) ， 我 们 使 用 一 个 缺陷 跟踪 
系统 ， 对 每 一 个 缺陷 都 用 数字 标 出 其 优先 级 。 我 们 的 优先 级 从 1 到 4, 1 级 是 一 些 不 严重 和 影响 
有 限 的 缺陷 ，4 级 是 那些 可 能 引起 系统 崩溃 的 、 需 要 优先 解决 的 缺陷 。 这 么 做 似乎 很 不 错 。 

然而 ,我们 有 太 多 缺陷 需要 修复 ,结果 我 们 只 会 注意 那些 最 高 优先 级 的 缺陷 。 当 然 ， 人 们 很 
快 就 会 发 现 ， 如 果 不 将 一 个 缺陷 设置 为 最 高 优先 级 ,就 几乎 不 会 被 人 理 竖 。 因 此 , HUSA, 我 
们 几乎 把 数据 库 中 的 每 一 个 缺陷 的 优先 级 都 设 为 了 4 级 。 

这 是 一 个 问题 , 因为 所 有 缺陷 的 重要 性 几乎 都 是 一 样 的 , 我 们 该 如 何 才能 知道 哪些 是 真正 需 
要 最 先 解决 的 呢 ? 

我 们 于 是 创建 一 个 新 的 优先 级 ，5 级 ， 专 门 针对 “真正 关键 ”的 缺陷 ， 这 种 方法 实行 了 一 段 
时 间 。 但是， 你 或 许 也 看 到 该 方案 的 缺点 了 一 一 过 了 一 段 时 间 ， 我 们 又 和 原来 一 样 了 ， 只 不 过 这 
次 所 有 的 缺陷 级 别 都 被 设 为 5 级 。 


我 离开 的 时 候 ， 我 们 已 经 把 优先 级 提高 到 7 级 了 。 


解决 方法 
如 果 你 发 现 自己 面临 着 夸大 优先 级 的 问题 时 ， 那 么 可 以 采用 如 下 的 解决 方法 。 
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O 定期 清除 你 的 缺陷 。 控制 缺 陷 数 据 库 一 一 定期 进行 审查 , 并 确保 缺陷 的 重点 优先 级 确实 能 
够 反映 出 它们 真正 的 优先 级 (代表 着 修复 它们 会 给 组 织带 来 的 价值 )。 

O 控制 缺陷 的 优先 级 。 人 允许 用 户 指 定 严重 性 ， 而 不 是 优先 级 。 要 有 一 个 良好 定义 的 过 程 ， 
通过 这 个 过 程 来 分 配 优 先 级 (例如 ， 一 个 类 选 团 队 )。 

口 不 要 用 数字 来 表示 优先 级 ， 按 照 优先 顺序 把 缺陷 列 出 来 。 这 很 类 似 于 Scrum 推荐 使 用 的 
产品 订单 方法 ( 见 《Scrum 进行 敏捷 项 目 管理 》[Sch04])。 


这 些 解决 方案 中 没有 一 个 能 够 找 出 发 生 缺 陷 的 根本 原因 一 一 质量 差 才 是 导致 大 量 缺 陷 的 原 
因 。 如 果 缺 陷 的 数量 不 断 增 加 ， 只 是 集中 于 管理 缺陷 的 方法 是 治标 不 治本 的 。 


虽然 这 不 是 一 件 容 易 的 事 ， 但 惟一 的 、 真 正 的 解决 办 法 就 是 控制 产品 质量 。 
11.2 ”超级 巨星 


我 曾经 和 一 个 “巨星 ” 共 过 事 。 他 是 团队 的 核心 人 物 ， 是 一 个 在 紧急 关头 大 家 可 以 依靠 的 、 
能 够 提出 解决 方案 的 人 。 他 非常 聪明 ， 工 作 效率 也 很 高 ， 远 远 超过 团队 里 的 其 他 任何 人 ， 他 对 整 
个 工作 流程 了 如 指 掌 ， 可 以 承担 任何 任务 。 


可 想 而 知 ， 管 理 层 非常 喜欢 他 。 要 是 我 们 都 成 为 他 的 克隆 ， 我 们 所 有 的 问题 都 将 得 到 解决 。 


他 写 的 代码 中 偶尔 也 会 有 几 个 问题 , 但 这 些小 问题 可 以 由 普通 的 工作 人 员 轻 松 地 处 理 , 而 他 
得 去 解决 下 一 个 难题 。 


但 愿 如 此 。 


虽然 从 表面 上 看 , 他 有 着 令 人 难以 置信 的 高 效 , 但 是 对 他 的 代码 进行 一 个 粗略 的 检查 就 会 发 
现 无 数 的 问题 显现 出 来 。 显 然 他 的 代码 是 匆忙 写 就 的 , 设计 没有 经 过 深思 熟 虚 , 没有 进行 充分 的 
测试 ， 存 在 不 必要 的 重复 。 结 果 就 是 大 量 的 缺陷 ， 遍 布 在 他 刚刚 实现 的 新 功能 和 其 他 老 地 方 。 


他 这 么 高 产 现在 看 来 真有 点 莫名 其 妙 一 一 他 只 做 了 一 半 的 工作 。 同样 莫名 其 妙 的 是 其 他 人 的 
生产 效率 非常 低下 一 一 他 们 花费 所 有 的 时 间 去 清理 他 留 下 的 烂摊子 。 当然 , 他 没有 承担 任何 责任 ， 
因为 当 问 题 出 现 的 时 候 ， 他 早已 经 离开 了 ， 着 手 解 决 下 一 个 引入 注目 的 、 需 要 的 “巨星 ”才能 解 
决 的 难题 了 。 


如 果 一 直 使 用 的 话 ， 这 个 反 模 式 特别 具有 破坏 性 。 它 
会 发 出 错误 的 信息 。 小 组 成 员 会 觉得 有 责任 心 会 适 得 其 
反 。 简 单 易 行 的 变通 方案 得 到 了 喝彩 一 一 忘记 质量 天 地 宽 。 
总 有 其 他 一 些 可 怜 虫 能 够 进行 收尾 工作 。 





EZRERUIAR, 
Prima donnas destroy teams. 





142 > 第 11 章 RH A 


当然 , 这 些 所 谓 可 怜 虫 是 不 可 能 感受 到 工作 的 乐趣 的 。 他 们 的 士气 会 受到 影响 , 这 会 导致 工 
作 质 量 下 降 ( 怕 什么 ? 显然 没 人 关心 ) 或 大 量 员工 离职 。 


解决 方法 


特 才 者 傲 物 。 他 们 能够 而 且 应 该 成 为 一 个 非常 有 价值 的 田 队 成 员 。 关键 在 于 如 何 驾驭 他 们 的 
才能 。 


之 所 以 有 人 目 空 一 切 是 因为 他 们 可 以 这 么 做 。 要 确保 你 的 开发 过 程 包含 足够 的 检验 机 制 和 平 
衡 机 制 ， 而 且 人 们 不 能 做 了 错 事 而 不 受 处 分 。 


O 确保 “完成 就 是 完成 .” 在 认真 仔细 地 完成 当前 工作 之 前 不 允许 任何 人 进入 下 一 个 任务 。 
这 意味 着 所 有 的 功能 都 被 测试 过 了 、 检 查 过 了 、 记 入 文档 了 , 你 的 开发 过 程 要 求 的 任何 环 
节 都 进行 了 。 

O 将 大 任务 分 解 成 具体 的 小 任务 。 对 待 每 一 个 任务 要 么 “完成 ”要 么 “没完 成 ”一 一 不 要 模 
楼 两 可 。 五 个 项 目的 80% 完 成 了 等 于 什么 也 没完 成 。 四 个 项 目 做 完了 ， 一 个 还 没 开始 做 ， 
AMY 80% 完 成 了 。 这 给 了 你 一 个 很 有 效 的 方法 来 告诉 你 真实 的 进度 。 

口 采用 “自负 自 责 ” 的 原则 一 一 解 铃 还 需 系 铃 人 ， 谁 造成 了 缺陷 谁 就 修复 它 。 如 果 团 队 的 核 
心 人 员 产 生 的 问题 后 期 才 暴 露出 来 ， 他 们 应 该 停止 一 切 已 经 转 做 的 新 工作 ,不 管 这 项 工作 
多 么 重要 ， 回 过 头 去 找到 问题 所 在 。 如 果 他 们 现在 做 的 工作 太 重要 了 ， 不 能 因 清 理 自己 的 
烂摊子 而 暂停 ， 那 么 就 让 其 他 和 来 进行 新 的 项 目 ， 而 不 是 去 帮助 他 们 擦 屁股 。 





W 小 乔 爱问 
总 如果 我 不 负责 会 怎样 呢 


本 章 的 一 个 早期 审阅 者 曾经 问 :“ 这 些 主意 不 错 ， 但 如 果 不 是 由 你 (读者 ) 来 决定 ， 管 


理 层 不 这 么 做 该 怎么 办 ? ” 


其 中 的 一 些 过 程 可 以 通过 “草根 ”运动 引入 ,这样 带 来 的 压力 会 出 奇 地 有 效 。 但 如 果 它 
不 起 作用 ， 任 何 有 权力 的 人 都 不 采取 行动 ， 那 么 有 时 你 该 考虑 拍 屁股 走 人 了 。 





11.3 ”维护 团队 


一 些 组 织 选择 将 开发 团队 和 维护 团队 分 开 。 开 发 团队 开发 软件 ， 然 后, 一旦 准备 部 署 ， 就 将 
其 交 给 维护 团队 ， 由 维护 团队 负责 缺陷 修复 和 运行 过 程 中 需要 做 的 改进 。 
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如 果 你 一 开始 就 认为 , 开发 软件 所 需 的 技能 不 同 于 维持 软件 所 需 的 技能 ， 那 么 这 样 安排 工作 


似乎 有 点 道理 。 不 巧 的 是 ， 这 种 结构 有 很 多 问题 ， 会 带 来 一 系列 的 问题 。 


Q 首先 ， 开 发 软件 所 需 的 技能 与 维护 软件 所 需 的 技能 没有 什么 大 的 不 同 。 软 件 工 程 就 是 软 
件 工程 ， 不 管 你 是 新 建 项 目 还 是 改进 已 有 的 项 目 。 

O 确定 你 的 设计 是 否 符 合 实践 ， 唯 一 的 办 法 就 是 看 它 在 实践 中 的 运行 效果 。 有 些 问题 只 有 
当真 实 的 用 户 使 用 软件 的 时 候 才 会 暴露 出 来 。 这 些 问题 由 原始 的 设计 者 进行 修复 更 为 有 
效 ， 因 为 他 比 其 他 人 更 了 解 软件 的 代码 。 

n 与 上 面 说 的 有 关 ， 如 果 设 计 师 已 经 转向 其 他 工作 了 ， 那 么 他 们 如 何 知 道 自己 的 工作 成 功 
与 否 ? 如 果 他 们 不 打算 反复 再 犯 同样 的 错误 的 话 ， 学 习 这 些 经 验 教训 是 十 分 关键 的 。 

a 虽然 你 的 项 目 计划 可 能 需要 清晰 地 将 开发 阶段 和 维护 阶段 分 开 ， 但 现实 可 能 是 非常 不 同 
的 .大 多 数 软件 在 维护 阶段 要 比 在 初始 开发 阶段 有 更 多 的 工作 要 做 这么 说 有 充分 的 理由 ， 
经 常 是 当 你 向 用 户 提交 软件 的 时 候 ， 他 们 才 意 识 到 应 该 需要 什么 。 

O 你 可 能 认为 随 软件 一 起 发 送 的 那 部 分 就 是 维护 团队 需要 的 所 有 信息 了 。 实际 上 , 这 几乎 
是 不 可 能 的 ,不 只 是 因为 当时 间 进 度 比较 紧 的 时 候 会 首先 压缩 文档 工作 。 关 于 软件 的 很 
多 知识 不 可 避免 地 都 是 隐 性 信息 ,这 些 隐 性 信息 很 难 从 文档 中 获得 ,不 管 你 多 么 一 丝 不 
苟 。” 

O 维护 团队 几乎 总 是 成 为 二 等 公民 。 由 于 这 种 二 等 地 位 的 感觉 ， 能 力 强 的 开发 人 员 往 往 会 
进入 开发 团队 而 能 力 弱 的 开发 人 员 会 进入 维护 团队 。 这 就 导致 了 “他 们 是 他 们 , 我 们 是 我 
们 ”的 情况 。 开 发 团队 的 人 不 明白 为 什么 那些 维护 团队 的 人 为 何 无 法 顺利 地 运行 软件 一 一 
毕竟 , 最 难 的 工作 已 经 完成 了 。 维护 团队 的 人 不 明白 为 什么 那些 开发 团队 的 人 提供 了 一 大 
堆 毫 无 价值 的 信息 却 不 用 承担 任何 责任 。 

o 如 果 创 建 软件 的 团队 首先 知道 ， 他 们 将 来 也 要 维护 这 个 软件 ， 那 么 团队 成 员 将 有 动力 确 
保 软 件 尽 可 能 地 易于 调试 和 改进 。 正 如 我 们 已 经 看 到 的 ， 从 一 开始 ,就 可 以 预 设 好 很 多 事 
情 来 帮助 我 们 。 但 是 ,如果 是 其 他 人 负责 , 那么 就 会 不 可 避免 地 把 它 排 在 所 有 要 做 的 工作 
的 最 后 面 。 


这 种 反 模式 也 适用 于 个 人 开发 人 员 。 让 一 个 新 的 团队 成 员 加 入 到 修复 缺陷 中 ,对 他 熟悉 这 个 


项 目 来 说 是 一 个 良好 的 、 温 和 的 开端 。 但是， 如 果 让 他 们 只 进行 缺陷 修复 ， 从 长 远 的 观点 看 ,不 
但 对 于 他 们 而 且 对 于 其 他 成 员 都 是 没有 任何 好 处 的 。 


O 对 于 在 团队 内 部 及 团队 之 间 如 何 进行 交流 ， 参 看 《敏捷 软件 开发 : 合作 博弈 》[Coc06]。 
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解决 方法 


KRDO BENERS 从 最 初 的 构思 到 最 终 布 署 的 整个 过 程 乃 至 以 后 的 维 
署 ， 整 个 过 竹 用 同一 个 国 队 。 ” 护 都 要 让 一 个 团队 来 完成 。 这 样 可 以 保持 连续 性 ， 确 保 团 
Keep one team from initial 队 成 员 的 工作 重点 与 组 织 的 工作 重点 紧密 关联 ， 并 允许 他 
concept through to deployment. 们 在 软件 的 生产 过 程 中 学 习 如 何 维护 软件 。 
注意 “专项 小 组 ”( 见 7.3 节 ) 不 是 我 们 这 里 讨论 的 维护 团队 。 专 项 小 组 是 为 解决 特定 的 问题 
临时 组 成 的 实体 ， 它 不 会 在 组 织 结构 中 长 期 存在 。 


11.4 ”救火 模式 
救火 模式 是 一 种 行为 模式 ， 在 这 种 模式 中 ， 面 对 很 多 关键 问题 ， 我 们 驾 转 于 其 间 ， 应 接 不 
中 地 解决 一 个 个 严重 的 问题 。 


我 们 所 有 人 都 有 这 种 倾向 。 当 客户 、 管 理 层 或 同事 都 冲 着 你 大 叫 ， 而 最 后 期 限 将 至 ， 你 走 投 
无 路 ， 别 无 选择 。 在 极 少 的 情况 下 ， 它 可 能 是 一 个 合适 的 行为 一 一 有 时 你 真 的 只 做 了 必须 做 的 ， 
刚好 把 问题 立即 解决 掉 。 


但 是 ， 如 果 你 经 常 或 长 时 间 地 陷入 救火 模式 不 能 自拔 ， 这 就 是 一 个 大 问题 了 。 
解决 方法 


长 期 或 反复 地 救火 会 破坏 代码 质量 和 团队 士气 。 如 果 你 发 现 自己 陷入 了 救火 模式 ,不 妨 退 一 
步 ， 先 找 出 问题 产生 的 根本 原因 ， 再 去 解决 这 些 问题 。 


说 起 来 容易 , 做 起 来 难 。 你 没有 时 间 去 寻找 问题 产生 的 根源 一 一 你 已 经 把 所 有 的 时 间 都 花费 
在 解决 一 个 又 一 个 问题 上 。 这 种 关头 以 退 为 进 并 着 眼 于 全 局 ， 是 非常 困难 的 。 


一 信和。 不 契 的 是 ,没有 一 次 救火 行动 会 解决 你 的 质量 问题 。 
USARAN. 事实 上 ， 恰恰 会 适得其反 。 
Firefighting, wip never Fe. 如 果 你 在 一 周 之 内 一 直 采 用 救火 模式 ， 局 面 却 仍然 处 


Lom Dn: 干 失控 状况 ， 只 是 更 加 努力 地 工作 是 不 会 也 不 能 有 什么 效 


果 的 。 无 论 得 到 什么 样 的 短期 结果 ， 你 都 需要 停 下 来 ， 让 自己 找 出 并 修复 根本 原因 。 
这 可 能 意味 着 你 要 采取 一 些 令 人 不 快 的 决定 。 您 可 能 需要 承受 一 些 短期 的 痛苦 ， 面 向 长 远 打 
好 坚实 的 基础 (7.3 节 给 出 了 如 何 做 的 建议 )。 
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当面 对 一 个 特别 麻烦 的 软件 时 ,使 用 亚历山大 大 帝 的 方法 来 解决 问题 是 很 有 诱惑 力 的 一 一 斩 断 
戈 尔 迪 乌 姆 结 ， 丢 弃 现 有 代码 而 快速 地 解决 问题 ， 然 后 重 写 新 的 代码 。 


有 时 候 , 这 确实 是 正确 的 解决 方法 , 但 经 验 表明 , 我 们 的 软件 工程 师 嘉 欢 动 辐 就 使 用 这 种 方法 。 


从 心理 学 的 观点 来 看 , 开发 新 的 代码 比 修改 旧 的 代码 让 人 更 加 舒服 。 我 们 天 生 的 乐观 感 使 我 
们 低估 了 复制 旧 功 能 所 要 付出 的 精力 和 时 间 。 


老 旧 生 锈 与 全 新 锂 亮 


在 软件 以 外 的 世界 中 ,我 对 赛车 充满 兴趣 。 因 此 ， 我 花费 很 多 周末 的 时 间 修 理 我 的 
赛车 ， 进 行 日 常 维护 ,修复 最 近 发 生 的 损伤 ， 或 者 为 了 在 比赛 中 再 赢得 关键 的 一 点 时 间 
而 升级 零 部 件 。 


由 于 多 种 原因 ， 有 次 我 从 头 开始 构建 了 一 辆 新 车 。 相 对 于 以 往 ， 这 是 一 段 美 妙 的 经 
历 。 我 不 用 去 修理 那些 可 能 几 年 前 就 松 开 了 的 、 如 今 凝结 在 油污 中 的 螺母 和 螺钉 ， 而 是 
直接 使 用 能 够 很 好 地 协调 工作 的 新 元 件 。 要 是 每 次 都 是 这 样 该 多 好 。 


但 赛车 永远 不 会 “ 即 插 即 用 "。 起 初 的 几 场 比赛 ， 你 不 断 寻找 和 解决 初期 必然 发 生 
的 问题 一 一 那些 小 毛病 导致 车 速 下 降 ， 或 者 让 你 中 途 退 出 比赛 。 只 有 在 解决 了 所 有 这 些 
问题 ， 你 才能 充分 发 挥 汽车 的 全 部 潜力 。 


在 这 个 领域 中 取得 领先 地 位 的 赛车 手 , 都 是 那些 坚持 不 懈 、 始 终 如 一 地 一 点 点 提升 
赛车 的 质量 的 人 。 


即使 代码 事实 上 并 没有 很 好 地 构建 ， 没 有 很 好 地 测试 ,或 者 没有 很 好 地 记 入 文档 ,即使 它 作 
为 产品 只 有 很 短 的 一 段 时 间 ， 它 也 是 大 部 分 时 间 在 工作 着 。 这 就 意味 着 ， 它 蕴涵 与 问题 有 关 的 大 
量 知识 一 一 这 些 知 识 不 可 能 在 其 他 的 任何 地 方 获得 。 


这 种 知识 是 微妙 的 、 难 以 在 需求 分 析 过 程 中 重新 获得 的 。 产 品 阶段 出 现 的 特例 一 一 “是 的 ， 
它 通 常 应 该 那么 做 , 但 对 这 一 特定 类 型 的 记录 ， 它 应 该 有 不 同 的 行为 ” 可 能 除了 在 源 代码 中 
之 外 , 不 会 被 记录 在 任何 文档 或 其 他 地 方 。 重 写 该 软件 ， 除 非 你 非常 小 心 ， 否 则 就 会 陷 人 回归 问 
题 ， 让 以 往 的 经 验 教 训 再 来 一 遍 。 


解决 方法 
对 任何 重 写 的 建议 都 要 抱 着 怀疑 的 态度 。 进 行 一 次 非常 细致 的 成 本 /收益 分 析 。 有 时 ， 旧 的 





146 > HE R # 式 


代码 真 的 是 烂 到 了 家 ， 我 们 不 值得 再 使 用 它 ， 但 应 花 些 时 间 来 证 明 给 自己 看 。 


如 果 你 决定 走 上 这 条 道路 ,那么 尽 可 能 减 小 风险 。 试 图 找到 一 个 方法 来 增 量 地 重 写 代码 ， 而 
不 是 彻头彻尾 地 推倒 重 来 。 





对 现 有 的 代码 进行 测试 ， 并 验证 得 到 了 相同 的 结果 。 
要 特别 小 心地 找 出 现 有 代码 能 正确 处 理 的 和 你 需要 重 做 
的 界限 。 


CSZ ELIR ET 
Avoid “big bang” rewrites. 
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极限 编程 的 一 个 做 法 〈 见 《极限 编程 解释 : 拥抱 变化 》[wCA04]) 就 是 集体 代码 所 有 权 ， 每 
一 个 团队 成 员 对 所 有 的 代码 都 负 有 责任 。 尤 其 是 , 任何 人 都 可 以 在 任何 地 方 修复 任何 缺陷 而 不 必 
与 原作 者 进行 沟通 。 

极限 编程 的 流行 (或 者 说 肆意 横行 ) 使 得 很 多 团队 采用 了 这 样 的 方法 ,并 不 总 是 应 用 在 极限 
编程 的 框架 内 。 这 可 能 会 导致 一 些 问题 。 集 体 代码 所 有 权 可 以 非常 地 有 效 ,但 应 用 不 当 ， 很 容易 
沦 为 一 种 情况 , 即 变 成 没有 代码 所 有 权 了 。 任何 人 都 可 以 在 任何 时 间 修 改 他 们 想 要 修改 的 任何 东 
西 ， 导 致 质量 低劣 ， 甚 至 落得 一 塌 糊 涂 ， 其 中 代码 被 来 回 地 重 构 ， 谁 看 了 都 想 改 一 改 。 


解决 方法 


在 极限 编程 中 集体 代码 所 有 权 是 有 效 的 , 因为 它 有 很 多 其 他 的 极限 编程 方法 支持 , 特别 是 结 
对 编程 、 测 试 优先 开发 ， 以 及 统一 的 编码 标准 。 如 果 没 有 这 些 或 者 其 他 的 实践 来 提供 类 似 的 支持 
的 话 ， 采 用 集体 代码 所 有 权 就 很 危险 。 

如 果 你 不 能 采取 这 些 辅助 手段 , 或许 共享 代码 所 有 权 并 不 适合 你 。 考 虑 采用 一 个 传统 的 模式 ， 
让 团队 成 员 (包括 大 团队 中 的 小 团队 ) 每 个 人 都 拥有 一 个 模块 。 


11.7 魔法 

你 不 会 觉得 我 们 软件 工程 师 会 很 迷信 吧 。 软 件 可 能 是 与 你 工作 在 一 起 的 最 透明 的 实体 一 一 如 果 
你 想 知道 为 什么 它 的 表现 会 是 那样 ， 那 么 你 需要 的 所 有 材料 都 在 源 代码 中 。 

然而 ， 许 多 项 目 似乎 有 自己 的 一 点 点 魔力 。 


口 “ 是 啊 ， 出 于 某 种 原因 ， 在 那 台 服务 器 上 构建 的 程序 总 是 出 错 。 不 知道 为 什么 ， 只 要 你 确 
保 始 终 不 要 从 那 台 服务 器 构建 程序 就 可 以 了 。 
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口 “ 哦 ， 你 出 现 了 那个 错误 。 你 需要 确保 按照 正确 的 顺序 启动 软件 。 它 不 应 该 有 差别 ， 但 由 
于 某 种 原因 它 确实 会 有 差别 。 
a “是 啊 ， 第 一 次 总 是 失败 ， 但 之 后 总 是 完美 收 官 。 不 要 担心 。” 


问题 是 这 种 话 本 身 就 表明 你 不 能 理解 软件 的 某 些 方面 。 任 何 你 不 理解 的 事物 都 可 能 隐藏 有 缺 


陷 。 
解决 方法 
在 这 种 情况 下 ， 唯 一 的 解决 办 法 的 是 纪律 。 将 你 不 理 EARO oR 
解 的 任何 事物 都 当 作 缺 陷 。 即 使 经 过 调查 ， 你 确定 它 不 是 SARB. 
缺陷 ， 那 你 也 一 定 会 学 到 一 些 东西 。 Treat anything you don't 


understand as Q bug. 
本 章 涵 盖 了 一 些 常见 的 反 模式 。 你 知道 ， 我 们 设 有 列 


全 。 人 类 的 聪明 才智 正体 现在 ,我们 已 经 发 明了 很 多 新 方法 让 自己 的 生活 更 加 狼 狐 。 要 用 挑剔 的 
目光 来 持续 地 检查 你 的 过 程 和 结构 ， 确 保 它们 真正 地 使 你 更 接近 目标 。 


在 你 的 软件 工程 师 的 职业 生涯 中 ,你 会 遇 到 让 人 诅 表 、 让 人 愤怒 、 上 涩 的 和 有 时 十 分 怪异 的 
软件 。 我 希望 已 经 介绍 的 工具 、 技 术 和 方法 会 给 你 一 些 帮 助 和 启发 ， 让 你 意识 到 自己 最 终 将 取得 
胜利 。 一 分 耕耘 一 分 收获 ， 收 获 的 喜悦 将 回报 你 所 有 的 辛劳 。 祝 你 一 帆 风 顺 ! 
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D 控制 缺陷 数据 库 ， 确 保 它 准确 地 反映 了 缺陷 的 优先 级 。 

口 自负 自 责 一 一 任何 人 在 完成 当前 任务 之 前 都 不 允许 转向 其 他 任务 。 如 果 在 他 们 的 工作 中 出 
现 了 缺陷 ， 让 他 们 自己 来 修复 。 

口 从 最 初 的 构思 到 最 终 布 署 的 整个 过 程 及 以 后 的 维护 都 要 让 同一 个 团队 来 完成 。 

a 救火 模式 永远 不 会 修复 质量 问题 。 花 些 时 间 找 出 并 修复 根本 原因 。 

o 避免 彻头彻尾 重 写 。 

口 确保 你 的 代码 所 属 权 策略 是 清晰 的 。 

O 将 不 理解 的 任何 事物 都 当 作 缺陷 。 


附录 A 


资 R 


这 可 能 是 老生 常 谈 , 但 也 能 很 好 地 解释 “如 果 你 只 有 一 把 锤子 ,一切 看 起 来 像 一 个 钉子 ”这 
个 谚语 存在 的 理由 。 专 业 人 士 的 标志 就 是 了 解 哪些 工具 可 以 使 用 并 能 够 选择 合适 工具 完成 任务 。 
本 附录 指出 了 一 些 使 用 较为 广泛 的 工具 。 


A1 源 代码 控制 及 问题 追踪 系统 
由 于 有 庞大 的 范围 可 供 挑选 ,选择 一 个 适合 你 的 源 代码 控制 和 问题 追踪 系统 并 不 困难 。 那 么 ， 
什么 可 能 动摇 你 的 决定 ? 需要 考虑 的 事项 包括 以 下 几 点 (并 不 全 面 )。 


a 开源 的 还 是 商用 的 ? 

n 你 需要 自己 管理 它 ( 例 如 ， 在 你 的 防火 墙 之 后 )， 还 是 想 托管 给 某 一 个 服务 商 ? 
Q 你 是 否 需 要 将 源 代码 控制 系统 和 问题 追踪 系统 紧密 地 结合 在 一 起 ? 

O 你 需要 对 分 布 式 开发 有 多 大 的 支持 ? 


这 里 我 无 法 全 面 分 析 所 有 不 同 的 源 代码 控制 和 问题 追踪 系统 ， 但 我 可 以 提 及 几 个 主要 工具 ， 
告诉 你 为 什么 要 考虑 使 用 它们 。 
A.1.1 开源 解决 方案 

CVS _http://www.nongnu.org/cvs/ 


直到 不 久 前 ， 唯 一 真正 开源 的 选择 还 是 CVS。 然 而 ，CVS 存在 -- 些 众所周知 的 限制 ， 尤 其 
是 check-in 操作 不 是 原子 性 的 ， 并 且 它 不 支持 版 本 目录 结构 。 


Subversion http://subversion.tigris.org/ 


在 过 去 几 年 ，CVS 几乎 被 Subversion 完全 代替 。Subversion 设法 解决 了 CVS 大 部 分 明显 的 
缺点 ， 并 且 已 经 成 为 默认 的 开源 选择 。 
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Git http://git.or.cz/ 


某 种 程度 上 , 真正 发 展 迅速 的 是 Git, Git 是 从 大 量 受到 高 关注 度 的 项 目 中 获取 思路 转化 而 来 ， 
这 很 大 程度 上 是 由 于 它 出 色 支 持 了 分 布 式 开发 。 


Mercurial http://www.selenic.com/mercurial/ 

这 是 一 个 跨 平台 的 分 布 式 系统 ， 与 Git 系统 有 相似 的 目标 ， 特 别 是 它 对 分 支 的 良好 支持 。 
Bazaar http://bazaar-ves.org/ 

它 被 设计 为 恰好 够 用 ， 适 应 你 的 团队 的 工作 流 而 不 是 强加 自己 的 模型 。 

Bugzilla http://www.bugzilla.org/ 


在 很 长 一 段 时 间 里 ， 作 为 Mozilla 项 目 一 部 分 而 开发 的 Bugzilla 是 问题 追踪 系统 的 默认 开源 
方案 。 然 而 ， 最 近 人 们 有 了 更 多 的 选择 。 


Trac http://trac.edgewall.org/ 


Trac 采 取 极 简 主 义 的 方法 ， 旨 在 尽量 避 开 开发 人 员 。 它 同 与 自己 的 wiki 网 站 的 结合 效果 是 尤 
其 著名 的 。 


Redmine __http://www.redmine.org/ 
相对 较 晚 进入 人 们 视野 的 Redmine 似乎 能 够 被 很 好 地 支持 ， 并 且 目 前 进展 良好 。 


开源 解决 方案 的 传统 弱项 是 在 开发 环境 中 对 源 代 码 控制 和 问题 跟踪 两 者 的 结合 。 最 
近 ， 这 样 的 状况 在 IDE 中 有 了 相当 程度 的 改进 ， 例 如 ，Eclipse 为 Subversion 提供 了 出 色 
的 支持 。 


A.1.2 托管 解决 方案 


SourceForge _http://sourceforge.net/ 


SourceForge 是 为 开源 项 目 提 供 托管 的 众多 网 站 中 最 著名 的 一 个 。 它 们 集合 了 大 量 工 具 , 例如 
源 代码 控制 、 问 题 跟踪 、 文 档 记 录 工 具 等 等 。 其 他 还 包括 Google Code (http://code.google. 
com/hosting/) 和 特定 语言 的 站 点 ， 例 如 RubyForge (http: /rubyforge.org/)。 


GitHub http://github.com/ 


GitHub 提供 Git 的 托管 ， 最 近 由 于 开始 托管 Ruby on Rails 项 目 而 备 受 瞩目 。 
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Lighthouse _http://lighthouseapp.com/ 


Lighthouse 是 一 个 综合 了 Subversion 和 Git 的 可 托管 的 问题 追踪 系统 。 

Unfuddle http://unfuddle.com/ 

这 是 一 个 安全 的 托管 项 目 管理 解决 方案 ， 提 供 Subversion 和 Git 的 托管 ， 并 集成 了 问题 追踪 
系统 。 

Rally http:/www.rallydev.com/ 


Rally 提供 了 敏捷 的 生命 周期 管理 工具 。 


VersionOne _http://www.versionone.com/ 


这 是 一 个 为 敏捷 软件 开发 而 特别 设计 的 项 目 管理 和 规划 工具 。 它 在 托管 的 同时 也 提供 本 地 安 
装 。 


Pivotal Tracker http://www.pivotaltracker.com/ 


Tracker 是 一 个 免费 、 展 获 殊荣 的 、 基 于 故事 的 项 目 规划 工具 ， 能 够 使 困 队 进行 实时 协作 。 
A.1.3 商业 解决 方案 


Perforce http://www.perforce.com/ 

Perforce 是 一 个 尤其 关注 跨 平台 支持 和 性 能 的 源 代码 控制 系统 。 它 还 包括 一 个 简单 的 问题 追 
踪 系 统 ， 也 可 以 结合 多 种 开源 或 商业 解决 方案 。 

FogBugz _http://www.fogcreek.com/FogBugz/ 

Fog Creek 公司 的 FogBugz 是 一 个 灵活 的 缺陷 追踪 和 项 目 规划 工具 ， 可 以 本 地 安装 或 作为 托 
管 解决 方案 。 传 统 上 用 于 Windows 系统 ， 但 正在 被 移植 到 Linux 和 Macintosh 平台。 

Visual Studio Team System _http://msdn.microsoft.com/teamsystem/ 

微软 的 Visual SourceSafe 长 期 以 来 都 是 众矢之的 ， 由 于 很 多 失败 的 案例 而 饱 受 批评 。 公 平地 
说 , 微软 公司 对 此 应 无 话 可 说 。 尽 管 公司 有 使 用 自己 产品 的 政策 , 但 是 看 起 来 它们 似乎 没 用 过 这 
个 软件 。 幸 运 的 是 , 微软 公司 一 直 没 有 停止 改进 这 款 提供 了 完全 集成 的 源 代 码 控制 及 项 目 管理 解 
决 方案 的 系统 。 

Rational ClearCase 及 ClearQuest http://ibm.com/software/awdtools/clearcase/ 


ClearCase 源 代码 控制 系统 , 以 及 与 它 结合 的 问题 追踪 解决 方案 ClearQuest, 过 去 常 被 认为 是 
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企业 的 默认 选择 。 然 而 ， 它 们 昂贵 且 复 杂 ， 它 们 只 适合 拥有 专门 支持 机 构 的 大 型 团队 。 
StarTeam http://www.borland.com/starteam/ 
这 是 一 个 完全 集成 的 源 代码 控制 和 项 目 管理 系统 。 
BitKeeper http://www.bitkeeper.com/ 
这 是 一 个 和 Git 有 相似 目标 的 分 布 式 系统 。 


A2 ”构建 和 持续 集成 工具 


我 们 已 经 详细 地 考察 了 构建 过 程 自 动 化 的 好 处 , 正如 你 所 期 望 的 那样 ， 有 许多 现成 的 工具 可 
以 帮 你 完成 这 些 工作 。 


A.2.1 构建 工具 
构建 工具 的 鼻祖 是 久负盛名 的 make。 事 易 时 移 ， 现 在 有 了 一 些 更 好 的 工具 可 供 选择 。 


GNU Make __http://www.gnu.org/software/make/ 
尽管 基于 make, GNU Make 仍 支持 数量 可 观 的 拓展 ， 人 允许 对 构建 过 程 进行 更 精密 的 控制 。 
Autoconf http://www.gnu.org/software/autoconf/ 


Autoconf 尤 其 适合 需要 支持 在 大 范围 的 不 同 环境 中 进行 构建 的 开源 软件 。 它 允许 构建 系统 自 
动 决 定 主机 系统 上 的 哪个 设备 可 用 并 进行 相应 的 工作 。 


Jam http://www.perforce.com/jam/jam.html 
Jam 通常 只 要 求 较 少 配置 就 能 完成 指定 项 目 。 

Boost.Build http://www.boost.org/doc/tools/build/ 

建立 在 Jam 之 上 的 Boost.Build 提供 一 个 标准 的 构建 系统 ， 尤 其 适合 托管 C++ 软件 。 
SCons http://www.scons.org/ 

这 是 一 个 综合 了 与 autoconf 相似 功能 的 make 的 替代 品 。 

Ant http://ant.apache.org/ 

这 是 一 个 make 的 替代 品 ， 它 已 在 Java 世界 中 成 为 事实 上 的 标准 构建 工具 。 
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Maven _http://maven.apache.org/ 


Maven 是 一 个 不 仅仅 简单 地 管理 构建 过 程 的 软件 项 目 管理 工具 ， 它 为 Java 世界 带 来 包 的 管 
理 、 部 署 等 功能 ， 并 且 正 在 快速 从 Ant 获 取 更 多 用 户 的 认同 。 


Capistrano http://www.capify.org/ 

就 其 本 身 而 言 并 不 是 构建 工具 ，Capistrano 在 大 量 不 同 的 服务 器 上 处 理 部 署 的 任务 。 尽 管 与 
Ruby on Rails 结合 得 特别 紧密 ， 它 仍 可 以 用 于 部 署 使 用 任何 技术 制造 的 产品 。 
A.2.2 ”持续 集成 工具 


许多 我 们 已 经 讨论 的 专 有 系统 (比如 微软 的 Visual Studio Team 系统 ) 都 带 有 它们 自己 的 持 
续集 成 解决 方案 。 此 外 ， 还 有 一 些 可 用 的 开源 系统 。 


CruiseControl http://cruisecontrol.sourceforge.net/ 


这 大 概 是 最 著名 的 开源 持续 集成 系统 。 除 了 主要 的 Java 实现 ， 还 存在 .NET 和 Ruby on Rails 
的 版 本 。 


Hudson __http://hudson.dev.java.net/ 
这 是 一 个 开放 源码 的 J2EE 持续 集成 服务 器 。 


A.3 有 用 的 库 文件 


并 非 所 有 的 工具 都 是 独立 的 ， 很 多 工具 ， 包 括 本 节 中 提 到 的 ， 都 以 库 文件 的 形式 存在 ， 我 们 
需要 将 它们 与 我 们 自己 的 代码 进行 连接 。 
A.3.1 测试 


过 去 几 年 ， 测 试 框架 雨后春笋 般 地 大 量 涌 现 ， 其 中 许多 都 参照 了 JUnit。 这 里 我 不 可 能 把 所 
有 的 工具 都 讲 到 ， 所 以 我 只 提 2 个 在 Java 社 区 中 最 具 分 量 的 工具 。 


JUnit http://www.junit.org/ 
它 是 库 文件 的 始祖 。 

TestNG http://testng.org/ 

这 是 最 新 的 一 个 测试 框架 ， 它 是 建立 在 JUnit 基 础 之 上 的 ， 但 是 采用 了 一 些 不 同 的 方法 ， 并 
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获得 了 广泛 的 使 用 。 
A.3.2 ”调试 内 存 分 配器 


正如 我 们 在 10.2 节 中 讨论 的 ， 在 像 C 和 C++ 这 样 不 提供 内 存 管理 的 语言 中 ， 调 试 内 存 分 配 
器 是 一 个 避免 内 存 泄漏 、 损 坏 和 其 他 常见 的 问题 的 不 可 或 缺 的 工具 。 


libcwd http://libcwd.sourceforge.net/ 
这 是 一 个 开放 的 源 代 码 调试 支持 库 ， 它 提供 内 存 调试 等 一 系列 功能 。 
Microsoft Visual C++ http://msdn.microsoft.com/visualc/ 


微软 的 Visual C++ 附带 了 一 个 内 置 调 试 内 存 分 配器 ， 和 欲 知 详情 ， 请 在 VC 文档 中 搜索 “内 存 
泄露 检测 和 隔离 ” (memory leak detection and isolation) 。 


Mudflap http://gcc.gnu.org/wiki/Mudflap_Pointer Debugging 


Mudflap 是 一 项 被 构建 到 某 些 版 本 的 GNU C 和 C++ 编译 器 中 的 技术 ， 它 可 以 检测 所 有 危险 
的 指针 和 数组 取 值 操作 、 一 些 标准 库 的 字符 串 函 数 和 堆 函 数 , 以 及 其 他 一 些 相关 结构 的 范围 和 有 
效 性 测试 。 


Dinkumware _http://www.dinkumware.com/ 
Dinkumware 销售 包含 广泛 支持 内 存 调试 的 C 和 C++ 标准 库 。 
Electric Fence _ http://perens.com/works/software/ElectricFence/ 


它 使 用 虚拟 内 存 硬盘 来 检测 内 存 覆 盖 与 再 利用 释放 的 内 存 。 
A.3.3 日 志 


日 志 框 架 可 让 代码 提供 可 配置 日 志 的 能 力 ,能 够 在 运行 时 根据 单个 特征 对 它 进 行 启用 、 禁 用 、 
增加 细节 。 

log4j http://logging.apache.org/log4j/ 

Apache log4j 大 概 是 最 知名 的 Java 日 志 库 ， 而 且 可 以 移植 到 现在 的 大 多 数 主要 语言 中 。 

Logback http://logback.qos.ch/ 

Logback 由 log4j 的 创始 人 Ceki Gülcü 设计 ， 作 为 log4i 的 继承 者 。 
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java.util.logging —http://java.sun.com/j2se/1.4.2/docs/guide/util/logging/ 
Á 1.4.2 #2, Java 包括 一 个 标准 的 日 志 API, java.util.logging, —-fe#RA JUL. 
SLF4J http://www.slf4j.org/ 


The Simple Logging Facade for Java 通过 提供 一 个 可 以 在 部 署 的 时 候 给 予 不 同 实现 的 通用 接 
口 ， 来 试图 统一 过 多 的 Java 日 志 API。 


syslog-ng http://www.balabit.com/network-security/syslog-ng/ 

syslog-ng 是 最 受 欢迎 的 BSD syslog 协议 的 实现 方案 ， 人 允许 将 数据 从 许多 不 同系 统 中 整合 到 
一 个 中 心 资料 库 系统 以 及 丰富 的 基于 内 容 的 过 滤器 。 
A.4 其 他 工具 

最 后 ， 这 是 每 一 个 开发 人 员 可 以 使 用 的 其 他 工具 的 快速 一 览 。 
A.4.1 测试 工具 


FitNesse http://fitnesse.org/ 


FitNesse 是 一 个 验收 测试 工具 ， 它 允许 将 测试 表现 为 表格 形式 的 输入 数据 和 预期 的 输出 数 
据 ， 在 Fit for Developing Software: Framework for Integrated Tests 一 书 [MC05] 中 有 详细 描述 。 


Watir http://wtr.rubyforge.org/ 


Watir 是 一 个 自动 化 Web 浏览 器 的 开源 库 ， 它 可 以 对 Web 应 用 程序 进行 自动 化 测试 。 它 最 初 
是 用 在 Windows 的 正 浏 览 器 中 的 ， 但 现在 正在 开发 其 他 浏览 器 的 版 本 。 


Selenium http://selenium.openqa.org/ 

Selenium 是 一 个 用 来 自动 化 构建 Web 应 用 程序 测试 的 跨 平 台 的 工具 套件 。 
Sahi http://sahi.co.in/ 

Sahi 是 一 种 针对 运行 在 代理 服务 器 上 的 Web 应 用 程序 的 自动 化 测试 工具 。 
The Grinder http://grinder.sourceforge.net/ 

这 是 一 个 使 用 Jython 作为 开发 脚本 的 开源 负载 测试 工具 。 
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JMeter http://jakarta.apache.org/jmeter/ 
这 是 一 个 使 用 Java 作为 开发 脚本 的 开源 负载 测试 工具 。 
QuickTest Professional 和 LoadRunner http://www.hp.com/ 


QuickTest Professional 是 一 个 自动 化 的 功能 GUI 测试 工具 , LoadRunner 是 一 种 性 能 和 人 负载 测 


试 产品 。 


Peach Fuzzing Platform _http://peachfuzzer.com/ 

Peach 是 一 个 兼 具 生 产 功能 和 变异 功能 的 模糊 器 。 

RFuzz http://rfuzz.rubyforge.org/ 

RFuzz 是 一 个 Ruby 库 ， 可 以 很 容易 地 对 Web 应 用 程序 进行 模糊 测试 。 


A4.2 运行 时 分 析 工 具 


Valgrind http://valgrind.org/ 
Valgrind 是 一 个 针对 Linux 的 工具 框架 ， 包 含 内 存 分 析 和 性 能 分 析 工 具 等 许多 东西 。 
BoundsChecker _http://www.compuware.com/products/devpartner/visualc.htm 


BoundsChecker 是 Compuware’s DevPartner for Visual C++ BoundsChecker Suite 的 一 部 分 。 它 


分 析 正 在 运行 的 程序 来 检测 内 存 等 问题 。 


Purify http://www.ibm.com/software/awdtools/purify/ 
IBM 的 Rational Purify 能 在 运行 的 程序 内 检测 内 存 泄露 和 内 存 损坏 问题 。 
DTrace http://opensolaris.org/os/community/dtrace/ 


DTrace 是 一 个 备 受 推崇 的 动态 追踪 框架 , 它 是 由 Sun 开发 的 用 于 解决 内 核 和 应 用 程序 问题 的 


工具 。 它 也 被 纳入 了 MacOSX “ŽW” Ri, HA Instruments GUI, 
A.4.3 网 络 分 析 器 


如 果 你 的 软件 依赖 于 网 络 通信 (很 难 找到 不 依赖 于 网 络 通 信 的 软件 了 )， 看 看 到 底 通过 网 络 


传输 了 什么 是 非常 有 用 的 。 


一 个 网 络 分 析 器 (有 时 也 被 称 为 数据 包 嗅 探 器 ) 位 于 网 络 之 中 ， 用 来 捕获 和 分 析 所 有 流 经 
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网 络 的 数据 包 。 然 后 ， 你 可 以 过 沥 这 些 数据 包 而 且 只 提取 那些 你 感 兴 趣 的 数据 ， 检 查 其 内 容 。 大 
致 来 说 , 一 个 包 嗅 探 器 是 一 种 底层 工具 。 它 可 以 捕获 所 有 的 网 络 流量 ,但 不 一 定 要 深入 了 解 使 用 
的 协议 。 所 以 ， 如 果 通 讯 内 容 被 加 密 了 ， 数 据 包 嗅 探 器 是 不 可 能 有 能 力 来 显示 被 交换 的 信息 的 。 


TCPDUMP http://www.tcpdump.org/ 

TCPDUMP 是 一 个 广泛 使 用 的 开源 数据 包 嗅 探 器 。 

Wireshark _ http://www.wireshark.org/ 

Wireshark (以 前 称 为 Ethereal) 是 一 个 开源 工具 ， 它 提供 了 类 似 TCPDUMP 的 功能 ， 但 它 有 
一 个 图 形 化 的 前 端 界 面 与 可 供 广泛 使 用 的 内 置 分 析 工 具 。 
A.4.4 调试 代理 


调试 代理 是 一 个 比 网 络 分 析 器 更 高 级 的 工具 ， 它 可 以 针对 特定 的 协议 进行 分 析 。 通常 需 要 对 
你 的 软件 进行 不 同 的 配置 ,以 便 它 可 以 过 代理 而 不 是 直接 通信 ， 经常 这 样 做 可 以 对 通信 内 容 进行 
更 深入 的 分 析 。 一 些 调试 代理 甚至 可 以 查看 加 密 的 数据 。 


Charles _http://www.charlesproxy.com/ 

Charles 是 一 个 跨 平台 的 HTTP 代理 ， 它 还 支持 对 加 密 的 通信 内 容 进 行 调试 。 

Fiddler _http://www.fiddlertool.com/ 

Fiddler 是 一 个 Windows HTTP 代理 , 正如 其 名 称 所 示 , 可 以 让 你 “窃取 ”传人 或 传 出 的 数据 。 


A4.5 调试 器 


在 大 多 数 情况 下 ， 你 选择 的 调试 器 由 你 选择 的 编程 语言 、IDE 或 工具 链 所 管理 ， 所 以 要 在 这 
里 提供 一 个 选择 清单 是 没有 什么 价值 的 。 但 是 ， 有 一 个 特殊 的 调试 器 我 必须 说 一 说 。 
Firebug http://getfirebug.com/ 


通过 提供 显著 改进 的 客户 端 调试 工具 ，Firebug 改变 了 Web 开发 。 它 可 以 让 你 检查 和 编辑 
DOM 和 CSS， 并 且 可 以 监测 和 分 析 网 络 活动 的 性 能 ， 并 提供 对 JavaScript 调试 的 完整 支持 。 


[Bec02] 


[Bro95] 


[Car71] 


[Coc06] 


[FBB*99] 


[Fow] 


[HT00] 


[iet99] 


[Knu74] 


[Lad03] 


[MC05] 


[OW07] 


[ray] 


[Ray01] 
[Scho4] 


附录 B 
参考 书目 


Kent Beck. Test Driven Development: By Example. Addison-Wesley, Reading, MA, 2002. 


Frederick P. Brooks, Jr. The Mythical Man Month: Essays on Software Engineering. Addison-Wesley, 
Reading, MA, anniversary edition, 1995. 


Lewis Carroll. Through the Looking-Glass, and What Alice Found There. Macmillan, 1871. 


Alistair Cockburn. Agile Software Development: The Cooperative Game, Addison Wesley Longman, 
Reading, MA, second edition, 2006. 


Martin Fowler, Kent Beck, John Brant, William Opdyke, and Don Roberts. Refactoring: Improving the 
Design of Existing Code. Addison Wesley Longman, Reading, MA, 1999. 


Martin Fowler, Mocks aren’t stubs. http://www.martinfowler.com/articles/mocksArentStubs.html. 


Andrew Hunt and David Thomas. The Pragmatic Programmer:From Journeyman to Master. 
Addison-Wesley, Reading,MA, 2000. 


Hypertext transfer protocol — http/1.1. http://www.w3.org/Protocols/rfc26 1 6/rfc2616.txt, 1999. 


Donald E. Knuth. Structured programming with go to statements. ACM Comput. Surv., 6(4):261-301, 
1974. 


Ramnivas Laddad. AspectJ in Action: Practical Aspect-Oriented Programming. Manning Publications 
Co., 2003. 


Rick Mugridge and Ward Cunningham. Fit for Developing Software: Framework for Integrated Tests. 
Prentice Hall PTR,Englewood Cliffs, NJ, 2005. 


Andy Oram and Greg Wilson, editors. Beautiful Code: Leading Programmers Explain How They Think. 
Theory in Practice.O’Reilly Media, Inc., Sebastopol, CA, 2007. 


The jargon file. http://catb.org/jargon/. 
Eric S. Raymond. The Cathedral and The Bazaar. O’Reilly& Associates, Inc, Sebastopol, CA, 2001. 


Ken Schwaber. Agile Project Management with Scrum.Microsoft Press, Redmond, WA, 2004. 


158 > HRB 参考 书目 


[Sut99] 


[Swi08] 


[wCA04] 


[Zac94] 


Herb Sutter. Exceptional C++: 47 Engineering Puzzles, Programming Problems, and Solutions. 
Addison-Wesley, Reading,MA, 1999. 


Travis Swicegood. Pragmatic Version Control using Git. The Pragmatic Programmers, LLC, Raleigh, 
NC, and Dallas, TX,2008. 


Kent Beck with Cynthia Andres. Extreme Programming Explained: Embrace Change. Addison-Wesley, 
Reading, MA,second edition, 2004. 


G. Pascal Zachary. Show Stopper!: The Breakneck Race to Create Windows NT and the Next Generation 
at Microsoft.Little, Brown, 1994. 


